$substrCP

Amazon DocumentDB の $substrCP演算子は、文字列から部分文字列を抽出するために使用されます。部分文字列は UTF-8 コードポイント (CP) の範囲として指定されます。この演算子は、文字の基になるバイト表現を心配することなく部分文字列を抽出できるため、Unicode 文字列を使用する場合に特に便利です。

バイト位置で動作する $substrBytes 演算子とは異なり、 $substrCP演算子はコードポイント位置を操作します。これにより、コードポイントの数がバイト数や文字数と一致しない可能性があるため、ASCII 以外の文字を含む文字列の操作が容易になります。

パラメータ

string: 部分文字列を抽出する入力文字列。
start: 部分文字列を抽出する開始コードポイントの位置 (ゼロベース）。
length: 抽出するコードポイントの数。

例 (MongoDB シェル)

この例では、 $substrCP演算子を使用して、従業員のデスクの場所を含む文字列から状態の略語を抽出します。

サンプルドキュメントを作成する


db.people.insert([
  { "_id": 1, "first_name": "Jane", "last_name": "Doe", "Desk": "12 Main St, Minneapolis, MN 55401" },
  { "_id": 2, "first_name": "John", "last_name": "Doe", "Desk": "456 Oak Rd, New Orleans, LA 70032" },
  { "_id": 3, "first_name": "Steve", "last_name": "Smith", "Desk": "789 Elm Ln, Bakersfield, CA 93263" }
]);

クエリの例


db.people.aggregate([
  {
    $project: {
      "state": { $substrCP: ["$Desk", 25, 2] }
    }
  }
]);

出力


{ "_id" : 1, "state" : "MN" }
{ "_id" : 2, "state" : "LA" }
{ "_id" : 3, "state" : "CA" }

この例では、状態の略語は Deskフィールドの 25 番目のコードポイントで始まり、2 つのコードポイントの長さであることがわかっています。$substrCP 演算子を使用すると、文字列の基になるバイト表現について心配することなく、状態の略語を抽出できます。

コードの例

$substrCP コマンドを使用するコード例を表示するには、使用する言語のタブを選択します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

$substrBytes

$subtract