Filtrar quais campos são indexados na pesquisa de texto completo do Neptune
Há dois campos nos detalhes do modelo do CloudFormation que permitem especificar chaves de propriedade ou predicado ou tipos de dados a serem excluídos da indexação do OpenSearch:
Filtrar por nome de propriedade ou predicado
É possível usar o parâmetro opcional do modelo do CloudFormation denominado Properties to exclude
from being inserted into Elastic Search Index para fornecer uma lista delimitada por vírgulas de chaves de propriedade ou predicado a serem excluídas da indexação do OpenSearch.
Por exemplo, digamos que você defina esse parâmetro como bob.
"Properties to exclude from being inserted into Elastic Search Index" : bob
Nesse caso, o registro de fluxo da seguinte consulta de atualização do Gremlin seria descartado em vez de inserido no índice:
g.V("1").property("bob", "test")
Da mesma forma, é possível definir o parâmetro como http://my/example#bob:
"Properties to exclude from being inserted into Elastic Search Index" : http://my/example#bob
Nesse caso, o registro de fluxo da seguinte consulta de atualização do SPARQL seria descartado em vez de inserido no índice:
PREFIX ex: <http://my/example#> INSERT DATA { ex:s1 ex:bob "test"}.
Se você não inserir nada nesse parâmetro do modelo do CloudFormation, todas as chaves de propriedade não excluídas de outra forma serão indexadas.
Filtrar por tipo de valor de propriedade ou predicado
É possível usar o parâmetro opcional do modelo do CloudFormation denominado Datatypes to exclude
from being inserted into Elastic Search Index para fornecer uma lista delimitada por vírgulas de tipos de dados de valor de propriedade ou predicado a serem excluídos da indexação do OpenSearch.
Para SPARQL, não é necessário listar o URI completo do tipo XSD. Basta listar o token do tipo de dados. Os tokens de tipos de dados válidos que você pode listar são:
stringbooleanfloatdoubledateTimedatetimebyteshortintlongdecimalintegernonNegativeIntegernonPositiveIntegernegativeIntegerunsignedByteunsignedShortunsignedIntunsignedLong
Para Gremlin, os tipos de dados válidos para listar são:
stringdateboolbyteshortintlongfloatdouble
Por exemplo, digamos que você defina esse parâmetro como string.
"Datatypes to exclude from being inserted into Elastic Search Index" : string
Nesse caso, o registro de fluxo da seguinte consulta de atualização do Gremlin seria descartado em vez de inserido no índice:
g.V("1").property("myStringval", "testvalue")
Da mesma forma, é possível definir o parâmetro como int:
"Datatypes to exclude from being inserted into Elastic Search Index" : int
Nesse caso, o registro de fluxo da seguinte consulta de atualização do SPARQL seria descartado em vez de inserido no índice:
PREFIX ex: <http://my/example#> PREFIX xsd:<http://www.w3.org/2001/XMLSchema#> INSERT DATA { ex:s1 ex:bob "11"^^xsd:int }.
Se você não inserir nada nesse parâmetro do modelo do CloudFormation, todas as propriedades cujos valores podem ser convertidos com segurança em equivalentes do OpenSearch serão indexadas. Os tipos listados que não são compatíveis com a linguagem de consulta são ignorados.