翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Neptune データプレーンバルクローダー API
一括ロードアクション:
一括ロード構造:
StartLoaderJob (アクション)
この API AWS の CLI 名は ですstart-loader-job。
Neptune バルクローダージョブを開始して、Amazon S3 バケットから Neptune DB インスタンスにデータをロードします。「Amazon Neptune バルクローダーを使用したデータの取り込み」を参照してください。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:StartLoaderJob IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
dependencies (CLI では:
--dependencies) — タイプstringの文字列 (UTF-8 でエンコードされた文字列)。これは、キュー内の 1 つ以上の前のジョブが正常に完了することを条件に、キューに入れられたロードリクエストを作成することができるオプションのパラメータです。
Neptune は、
queueRequestパラメータが"TRUE"に設定されている場合、一度に最大 64 個のロードリクエストをキューに入れることができます。dependenciesパラメータを使用すると、キュー内で指定された 1 つ以上前のリクエストが正常に完了したかどうかに応じて、キューに入れられたそのようなリクエストを実行できます。たとえば、ロード
Job-AとJob-Bが互いに独立しているものの、ロードJob-Cを開始する前にJob-AおよびJob-Bを終了する必要がある場合は、次の手順を実行します。-
任意の順序で
load-job-Aとload-job-Bを 1 つずつ送信し、load-id を保存します。 -
dependenciesフィールドで 2 つのジョブの load-id を付けてload-job-Cを送信します。
"dependencies" : ["(job_A_load_id)", "(job_B_load_id)"]dependenciesパラメータのため、Job-AとJob-Bが正常に完了するまで、バルクローダーはJob-Cを起動しません。いずれかが失敗すると、Job-C は実行されず、そのステータスはLOAD_FAILED_BECAUSE_DEPENDENCY_NOT_SATISFIEDに設定されます。この方法で複数のレベルの依存関係を設定できます。これにより、1 つのジョブが失敗すると、直接的または間接的に依存するすべてのリクエストがキャンセルされます。
-
-
failOnError (CLI では:
--fail-on-error) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。failOnError- エラー時に完全な停止を切り替えるフラグ。使用できる値:
"TRUE"、"FALSE"。デフォルト値:
"TRUE"。このパラメータを
"FALSE"に設定すると、ローダーは指定された場所のすべてのデータをロードし、エラーのあるエントリはスキップします。このパラメータを
"TRUE"に設定すると、ローダーはエラー発生時にすぐに停止します。その時点までロードされたデータは保持されます。 -
format (CLI では:
--format) — 必須:stringタイプの形式 (UTF-8 でエンコードされた文字列)。データの形式です。Neptune
Loaderコマンドのデータ形式の詳細については、「データ読み込み形式」を参照してください。許可される値
-
csvGremlin CSV データ形式用。 -
opencypheropenCypher CSV データ形式用。 -
ntriplesN-Triples RDF データ形式用。 -
nquadsN-Quads RDF データ形式用。 -
rdfxmlRDF\XML RDF データ形式用。 -
turtleTurtle RDF データ形式用。
-
-
iamRoleArn (CLI では:
--iam-role-arn) — 必須:stringタイプの文字列 (UTF-8 でエンコードされた文字列)。S3 バケットにアクセスするために、Neptune DB インスタンスによって想定される IAM ロールの Amazon リソースネーム (ARN)。ここで指定した IAM ロール ARN は DB クラスターにアタッチする必要があります (「Amazon Neptune クラスターへの IAM ロールの追加」を参照)。
-
mode (CLI では:
--mode) — タイプstringのモード (UTF-8 でエンコードされた文字列)。ロードジョブモード。
使用できる値:
RESUME、NEW、AUTO。デフォルト値:
AUTO。-
RESUME- RESUME モードでは、ローダーはこのソースからの以前のロードを検索し、見つかった場合は、そのロードジョブを再開します。以前のロードジョブが見つからない場合、ローダーは停止します。ローダーは、以前のジョブで正常にロードされたファイルの再ロードを回避します。失敗したファイルの処理のみを試行します。以前にロードしたデータを Neptune クラスターから削除している場合、そのデータはこのモードでは再ロードされません。以前のロードジョブが同じソースからすべてのファイルを正常にロードした場合、何も再ロードされず、ローダーは成功を返します。
-
NEW- NEW モードでは、以前のロードに関係なく、新しいロードリクエストが作成されます。このモードを使用して、以前にロードされたデータを Neptune クラスターから削除した後にソースからすべてのデータを再ロードしたり、同じソースから利用可能な新しいデータをロードしたりするために使用できます。 -
AUTO- AUTO モードでは、ローダーは同じソースから以前のロードジョブを検索し、見つかった場合は、RESUMEモードと同様にそのジョブを再開します。ローダーが同じソースから以前のロードジョブを見つけられない場合、
NEWモードの場合と同様に、ソースからすべてのデータがロードされます。
-
-
parallelism (CLI では:
--parallelism) — タイプstringのパラレリズム (UTF-8 でエンコードされた文字列)。一括ロードプロセスで使用されるスレッド数を減らすように設定できるオプションの
parallelismパラメータ。許可される値:
-
LOW- 使用されるスレッドの数は、コア数を 8 で割った値です。 -
MEDIUM- 使用されるスレッドの数は、コア数を 2 で割った値です。 -
HIGH- 使用されるスレッドの数は、コア数と同じです。 -
OVERSUBSCRIBE- 使用されるスレッドの数は、コア数に 2 をかけた値です。この値を使用する場合、バルクローダーは利用可能なすべてのリソースを消費します。ただし、これは、
OVERSUBSCRIBE設定すると、CPU 使用率が 100% になります。ロードオペレーションは I/O バウンドであるため、予想される CPU 最高使用率は 60% ~ 70% の範囲にあります。
デフォルト値:
HIGHparallelismopenCypher データをロードするときに、設定によってスレッド間でデッドロックが発生することがあります。こうなると、Neptune はLOAD_DATA_DEADLOCKというエラーを返します。通常、この問題は次のようにして修正できます。parallelismより低い設定にし、ロードコマンドを再試行します。 -
-
parserConfiguration (CLI では:
--parser-configuration) - キと値のペアのマップ配列。各キーは、タイプ
stringの文字列 (UTF-8 でエンコードされた文字列) です。各値は、タイプ
stringの文字列 (UTF-8 でエンコードされた文字列) です。parserConfiguration- 追加のパーサー設定値のあるオプションのオブジェクト。それぞれの子パラメータもオプションです。-
namedGraphUri- グラフが指定されていない場合の、すべての RDF 形式のデフォルトのグラフ (四角形でない形式、およびグラフのない NQUAD エントリ)。デフォルトは
https://aws.amazon.com/neptune/vocab/v01/DefaultNamedGraphです。 -
baseUri- RDF/XML および Turtle 形式の基本 URI。デフォルトは
https://aws.amazon.com/neptune/defaultです。 -
allowEmptyStrings- Gremlin ユーザーは、CSV データを読み込むときに、ノードおよびエッジのプロパティとして空の文字列値 ("") を渡す必要があります。allowEmptyStringsがfalse(デフォルト) に設定されている場合、そのような空の文字列は NULL として扱われ、ロードされません。allowEmptyStringsがtrueに設定されている場合、ローダーは空の文字列を有効なプロパティ値として扱い、それに応じてロードします。
-
-
queueRequest (CLI では:
--queue-request) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。これは、ロードリクエストをキューに入れることができるかどうかを示すオプションのフラグパラメータです。
queueRequestパラメータをすべて"TRUE"に設定している場合、Neptune は一度に最大 64 個のジョブをキューに入れることができるので、次のジョブを発行する前に 1 つのロードジョブが完了するのを待つ必要はありません。ジョブのキューの順序は、FIFO (先入れ先出し) です。queueRequestパラメータを省略するるか、"FALSE"に設定した場合、別のロードジョブがすでに実行されていると、ロードリクエストは失敗します。使用できる値:
"TRUE"、"FALSE"。デフォルト値:
"FALSE"。 -
s3BucketRegion (CLI では:
--s-3-bucket-region) — 必須:stringタイプの S3BucketRegion (UTF-8 でエンコードされた文字列)。S3 バケットの Amazon リージョン。これは DB クラスターの Amazon リージョンと一致する必要があります。
-
source (CLI では:
--source) — 必須:stringタイプの文字列 (UTF-8 でエンコードされた文字列)。sourceパラメータは、単一のファイル、複数のファイル、1 つのフォルダ、または複数のフォルダを識別する S3 URI を受け入れます。Neptune は、指定されたフォルダ内のすべてのデータファイルをロードします。URI は、以下の形式のいずれかになります。
-
s3://(bucket_name)/(object-key-name) -
https://s3.amazonaws.com/(bucket_name)/(object-key-name) -
https://s3.us-east-1.amazonaws.com/(bucket_name)/(object-key-name)
URI の
object-key-name要素は、S3 の ListObjects API コール内の prefix パラメータと同等です。これは、名前がそのプレフィックスで始まる指定された S3 バケット内のすべてのオブジェクトを識別します。これは、単一のファイルまたはフォルダ、または複数のファイルやフォルダにすることができます。特定のフォルダには複数の頂点ファイルおよび複数のエッジファイルが含まれている場合があります。
-
-
updateSingleCardinalityProperties (CLI では:
--update-single-cardinality-properties) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。updateSingleCardinalityPropertiesは、バルクローダーが単一濃度の頂点またはエッジプロパティの新しい値を処理する方法を制御するオプションのパラメータです。これは openCypher データのロードではサポートされていません。使用できる値:
"TRUE"、"FALSE"。デフォルト値:
"FALSE"。デフォルトでは、または
updateSingleCardinalityPropertiesが明示的に"FALSE"に設定されている場合、ローダーは単一の濃度に違反するため、新しい値をエラーとして扱います。一方、
updateSingleCardinalityPropertiesが"TRUE"に設定されている場合、バルクローダーは既存の値を新しい値に置き換えます。ロードされるソースファイルで複数のエッジまたは単一濃度の頂点プロパティ値が指定されている場合、バルクロードの終了時の最終値は、これらの新しい値のいずれかになります。ローダーは、既存の値が新しい値の 1 つに置き換えられたことを保証します。 -
userProvidedEdgeIds (CLI では:
--user-provided-edge-ids) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。このパラメータは、リレーションシップ ID を含む openCypher データをロードする場合にのみ必要です。openCypher 関係 ID がロードデータに明示的に指定されている場合 (推奨)、必ず含められ
Trueに設定されています。userProvidedEdgeIdsがないか、Trueに設定されている場合、:ID列は、ロード内のすべてのリレーションシップファイルにある必要があります。userProvidedEdgeIdsがあり、Falseに設定されている場合、ロード内のリレーションシップファイルに:ID列があってはなりません。代わりに、Neptune ローダーは各リレーションシップの ID を自動的に生成します。CSV データのエラーが修正された後にローダーがロードを再開できるように、リレーションシップ ID を明示的に指定すると便利です。すでにロードされているリレーションシップをリロードする必要はありません。リレーションシップ ID が明示的に割り当てられていない場合、リレーションシップファイルを修正する必要があれば、ローダーは失敗したロードを再開できず、代わりにすべてのリレーションシップを再ロードする必要があります。
レスポンス
-
payload – 必須: キーと値のペアのマップ配列。
各キーは、タイプ
stringの文字列 (UTF-8 でエンコードされた文字列) です。各値は、タイプ
stringの文字列 (UTF-8 でエンコードされた文字列) です。ロード操作の識別子となる
loadId名前と値のペアを含みます。 -
status - 必須: タイプ
stringの文字列 (UTF-8 でエンコードされた文字列)。ロードジョブのステータスを示す HTTP リターンコード。
エラー
GetLoaderJobStatus (アクション)
この API AWS の CLI 名は ですget-loader-job-status。
指定されたロードジョブに関する情報を取得します。Neptune は、直近 1,024 個のバルクロードジョブのみを追跡し、ジョブごとに直近 10,000 個のエラーの詳細のみを保存します。
詳細については、「Neptune Loader Get-Status API」を参照してください。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:GetLoaderJobStatus IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
details (CLI では:
--details) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。全体のステータス以外の詳細を含めるかどうかを示すフラグ (
TRUEまたはFALSE、デフォルトはFALSE)。 -
errors (CLI では:
--errors) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。発生したエラーのリストを含めるかどうかを示すフラグ (
TRUEまたはFALSE、デフォルトはFALSE)。エラーのリストはページ分割されます。
pageおよびerrorsPerPageパラメータで、すべてのエラーをページ分割できます。 -
errorsPerPage (CLI では:
--errors-per-page) — タイプintegerの PositiveInteger (符号付き32ビット整数)、少なくとも 1? st?。各ページで返されるエラーの数 (正の整数、デフォルトは
10)。errorsパラメータがTRUEに設定されている場合にのみ有効です。 -
loadId (CLI では:
--load-id) — 必須:stringタイプの文字列 (UTF-8 でエンコードされた文字列)。ステータスを取得するロードジョブのロード ID。
-
page (CLI では:
--page) — タイプintegerの PositiveInteger (符号付き32ビット整数)、少なくとも 1? st?。エラーページ番号 (正の整数、デフォルトは
1)。errorsパラメータがTRUEに設定されている場合にのみ有効です。
レスポンス
-
payload - 必須: タイプ
documentのドキュメント (JSON のようなデータモデルで表される、プロトコルに依存しないオープンコンテンツ)。ロードジョブに関するステータス情報。レイアウトは次のようになります。
{ "status" : "200 OK", "payload" : { "feedCount" : [ { "LOAD_FAILED" : (number) } ], "overallStatus" : { "fullUri" : "s3://(bucket)/(key)", "runNumber" : (number), "retryNumber" : (number), "status" : "(string)", "totalTimeSpent" : (number), "startTime" : (number), "totalRecords" : (number), "totalDuplicates" : (number), "parsingErrors" : (number), "datatypeMismatchErrors" : (number), "insertErrors" : (number), }, "failedFeeds" : [ { "fullUri" : "s3://(bucket)/(key)", "runNumber" : (number), "retryNumber" : (number), "status" : "(string)", "totalTimeSpent" : (number), "startTime" : (number), "totalRecords" : (number), "totalDuplicates" : (number), "parsingErrors" : (number), "datatypeMismatchErrors" : (number), "insertErrors" : (number), } ], "errors" : { "startIndex" : (number), "endIndex" : (number), "loadId" : "(string), "errorLogs" : [ ] } } } -
status - 必須: タイプ
stringの文字列 (UTF-8 でエンコードされた文字列)。リクエストの HTTP レスポンスコード。
エラー
ListLoaderJobs (アクション)
この API AWS の CLI 名は ですlist-loader-jobs。
すべてのアクティブローダージョブの loadIds のリストを取得します。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:ListLoaderJobs IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
includeQueuedLoads (CLI では:
--include-queued-loads) — タイプbooleanのブール値 (ブール値 (真または偽) の値)。パラメータを
FALSEに設定することによってロード ID のリストをリクエストしたときに、キューに入れられたロードリクエストのロード ID を除外するために使用できるオプションのパラメータ。デフォルト値はTRUEです。 -
limit (CLI では:
--limit) — ListLoaderJobsInputLimitInteger、タイプinteger(符号付き 32 ビット整数)、1 以上か 1024 以上? st? s。一覧表示されるロード ID の数。0 より大きく、
100(デフォルト) 以下の正の整数でなければなりません。
レスポンス
-
payload – 必須: LoaderIdResult オブジェクト。
要求されたジョブ ID のリスト。
-
status - 必須: タイプ
stringの文字列 (UTF-8 でエンコードされた文字列)。ジョブリストリクエストのステータスを返します。
エラー
CancelLoaderJob (アクション)
この API AWS の CLI 名は ですcancel-loader-job。
指定されたロードジョブをキャンセルします。これは HTTP DELETE リクエストです。詳細については、「Neptune Loader Get-Status API」を参照してください。
IAM 認証が有効になっている Neptune クラスターでこの操作を呼び出すときには、リクエストを行う IAM ユーザーまたはロールに、そのクラスターで neptune-db:CancelLoaderJob IAM アクションを許可するポリシーがアタッチされている必要があります。
リクエスト
-
loadId (CLI では:
--load-id) — 必須:stringタイプの文字列 (UTF-8 でエンコードされた文字列)。削除されるロードジョブの ID。
レスポンス
-
status — タイプ
stringの文字列 (UTF-8 でエンコードされた文字列)。キャンセルステータス。
エラー
一括ロード構造:
LoaderIdResult (構造)
ロード ID のリストを含みます。
フィールド
-
loadIds - 文字列、タイプ:
string(UTF-8 でエンコードされた文字列)。ロード ID のリスト。