$bucket - Amazon DocumentDB

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

$bucket

버전 8.0의 새로운 기능

Elastic 클러스터에서는 지원되지 않습니다.

Amazon DocumentDB의 $bucket 집계 단계를 사용하면 지정된 표현식 및 버킷 경계를 기반으로 입력 문서를 버킷으로 그룹화할 수 있습니다. 이는 특정 값 범위 또는 범주에 속하는 데이터를 분석하는 데 유용할 수 있습니다.

파라미터

  • groupBy (필수): 그룹화할 값을 지정하는 표현식입니다.

  • boundaries (필수): 버킷 경계를 정의하는 이중 값의 배열입니다. 문서는 지정된 경계 내에 속하는 groupBy 표현식 값을 기반으로 버킷에 할당됩니다.

  • default (선택 사항): groupBy 표현식 값이 지정된 경계에 속하지 않는 문서에 대해 출력되는 리터럴 값입니다.

  • output (선택 사항): 각 버킷에 대해 출력할 정보를 지정하는 객체입니다. $sum, $avg$min, 및 같은 누적기 연산자를 사용하여 각 버킷에 대한 집계를 계산$max할 수 있습니다.

예제(MongoDB 쉘)

다음 예제에서는 $bucket 스테이지를 사용하여 판매 데이터를 가격 범위별로 그룹화하는 방법을 보여줍니다.

샘플 문서 생성

db.sales.insertMany([ { item: "abc", price: 10, quantity: 2, date: new Date("2020-09-01") }, { item: "def", price: 20, quantity: 1, date: new Date("2020-10-01") }, { item: "ghi", price: 5, quantity: 3, date: new Date("2020-11-01") }, { item: "jkl", price: 15, quantity: 2, date: new Date("2020-12-01") }, { item: "mno", price: 25, quantity: 1, date: new Date("2021-01-01") } ]);

쿼리 예제

db.sales.aggregate([ { $bucket: { groupBy: "$price", boundaries: [0, 10, 20, 30], default: "Other", output: { "count": { $sum: 1 }, "totalQuantity": { $sum: "$quantity" } } } }, { $sort: { _id: 1 } } ])

출력

[ { _id: 0, count: 1, totalQuantity: 3 }, { _id: 10, count: 2, totalQuantity: 4 }, { _id: 20, count: 2, totalQuantity: 2 } ]

코드 예제

$bucket 명령을 사용하기 위한 코드 예제를 보려면 사용하려는 언어의 탭을 선택합니다.

Node.js
const { MongoClient } = require('mongodb'); async function example() { const client = await MongoClient.connect('mongodb://<username>:<password>@<cluster-endpoint>:27017/?tls=true&tlsCAFile=global-bundle.pem&replicaSet=rs0&readPreference=secondaryPreferred&retryWrites=false'); const db = client.db('test'); const sales = db.collection('sales'); const result = await sales.aggregate([ { $bucket: { groupBy: "$price", boundaries: [0, 10, 20, 30], default: "Other", output: { "count": { $sum: 1 }, "totalQuantity": { $sum: "$quantity" } } } }, { $sort: { _id: 1 } } ]).toArray(); console.log(result); client.close(); } example();
Python
from pymongo import MongoClient def example(): client = MongoClient('mongodb://<username>:<password>@<cluster-endpoint>:27017/?tls=true&lsCAFile=global-bundle.pem&replicaSet=rs0&readPreference=secondaryPreferred&retryWrites=false') db = client['test'] sales = db['sales'] result = list(sales.aggregate([ { '$bucket': { 'groupBy': '$price', 'boundaries': [0, 10, 20, 30], 'default': 'Other', 'output': { 'count': {'$sum': 1}, 'totalQuantity': {'$sum': '$quantity'} } } }, { "$sort": { "_id": 1 } } ])) print(result) client.close() example()