View a markdown version of this page

Formats de chargement de données - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Formats de chargement de données

L'API Amazon Neptune Load permet le chargement de données dans différents formats.

Property-graph formats de chargement

Les données chargées dans l'un des formats de graphes de propriétés suivants peuvent être interrogées à l'aide de Gremlin et d'openCypher :

Formats de chargement RDF

Pour charger des données RDF (Resource Description Framework) à interroger avec SPARQL, vous pouvez utiliser l'un des formats standard suivants comme spécifié par W3C (World Wide Web Consortium) :

Les données de chargement doivent utiliser le UTF-8 codage

Important

Tous les fichiers de données de chargement doivent être codés sous UTF-8 forme. Si un fichier n'est pas UTF-8 codé, Neptune essaie de le charger tel UTF-8 quel.

Pour N-Quads les N-triples données contenant des caractères Unicode, les séquences d'\uxxxxxéchappement sont prises en charge. Toutefois, Neptune ne prend pas en charge la normalisation. Si une valeur nécessite une normalisation, elle ne sera pas mise en correspondance octet à octet lors de l'interrogation. Pour plus d'informations sur la normalisation, consultez la page Normalisation sur Unicode.org.

Si vos données ne sont pas dans un format pris en charge, vous devez les convertir avant de les charger.

Un outil de conversion de GraphML au format Neptune CSV est disponible dans le projet GraphML2CSV sur. GitHub

Prise en charge de la compression des fichiers de chargement de données

Neptune prend en charge la compression des fichiers individuels au format gzip ou bzip2.

Le fichier compressé doit avoir une .bz2 extension .gz ou et doit être un seul fichier texte codé au UTF-8 format. Vous pouvez charger plusieurs fichiers, mais chacun d'entre eux doit être un fichier .gz, .bz2 ou non compressé distinct. Les fichiers d'archive portant des extensions telles que .tar, .tar.gz et .tgz ne sont pas pris en charge.

Les sections suivantes décrivent les formats de façon plus détaillée.