문서 이해
참고
이 설명서는 Amazon Nova 버전 1용입니다. Amazon Nova 2 문서 이해 가이드는 문서 이해를 참조하세요.
Amazon Nova의 문서 이해 기능을 사용하면 프롬프트에 전체 문서(PDF, Word 파일, 스프레드시트 등)를 포함하고 콘텐츠에 대해 질문하거나 요청할 수 있습니다. Nova의 멀티모달 이해 모델(Lite, Pro, Premier)은 이러한 문서 내의 텍스트 및 시각적 요소(예: 차트 또는 테이블)를 모두 해석할 수 있습니다. 이를 통해 질문 답변, 요약, 긴 보고서 또는 스캔 문서 분석과 같은 사용 사례를 지원할 수 있습니다. 주요 기능에는 긴 문서를 위한 초대형 컨텍스트 창(1~2M 토큰)과 단일 쿼리에서 여러 문서를 처리할 수 있는 기능이 포함됩니다.
Amazon Nova는 문서 입력을 두 가지 유형으로 구분합니다.
-
텍스트 기반 문서 유형(예: TXT, CSV, 마크다운, HTML, DOC): 주로 텍스트 콘텐츠에 대해 처리됩니다. Nova는 이러한 문서의 텍스트에서 정보를 이해하고 추출하는 데 중점을 둡니다.
-
미디어 기반 문서 유형(예: PDF, DOCX): 이러한 파일에는 복잡한 레이아웃, 이미지, 차트 또는 임베디드 그래픽이 포함될 수 있습니다. 미디어 기반 문서의 경우 Nova는 시각적 요소와 텍스트 요소를 모두 처리합니다. Nova는 비전 기반 이해를 활용하여 문서 텍스트와 함께 차트, 테이블, 다이어그램 또는 스크린샷과 같은 시각적 콘텐츠를 해석합니다.
JPEG2000 및 JBIG2는 Amazon Nova의 PDF 파일에서 지원되지 않습니다.
지원되는 파일 형식에는 일반 텍스트 및 구조화된 텍스트 파일(CSV, TXT), 스프레드시트(XLS/XLSX), HTML/마크다운, Word 문서(DOC/DOCX), PDF 파일과 같은 일반적인 문서 유형이 포함됩니다. 문서 내 이미지의 경우 표준 이미지 형식(PNG, JPG, GIF, WebP)은 처리되지만 특정 이미지 인코딩(CYMK, SVG)이 포함된 PDF는 지원되지 않습니다.
| 제약 조건 | Limit |
|---|---|
|
최대 문서 수 |
요청당 최대 5개의 문서(직접 업로드와 Amazon S3 모두에 적용됨) |
|
텍스트 기반 문서 크기 |
각 텍스트 문서(예: .txt, .csv, .md, .html, .doc)는 ≤ 4.5MB여야 합니다. |
|
미디어 기반 문서 크기 |
.pdf 및 .docx 파일의 경우 개별 파일 크기 제한은 없지만 다음과 같습니다.
|
|
지원되지 않는 PDF 콘텐츠 |
CMYK 색상 프로필 또는 SVG 이미지가 포함된 PDF는 지원되지 않습니다. |