기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
사용자 지정 어휘
언어별로 도메인별 단어와 문구를 제공하여 BDA가 오디오 및 비디오 콘텐츠의 추출 정확도를 개선할 수 있습니다. BDA가 처리된 콘텐츠에서 해당 용어를 정확하게 인식하고 추출할 수 있도록 브랜드 이름, 두문자어, 고유 명사, 특수 용어 등 업계 또는 도메인에 고유한 용어를 포함할 수 있습니다.
중요
Bedrock Data Automation Library를 사용할 때 자체 데이터의 무결성에 대한 책임은 사용자에게 있습니다. 기밀 정보, 개인 정보(PII) 또는 보호 대상 건강 정보(PHI)를 사용자 지정 어휘에 입력하지 마세요.
여기에서 사용자 지정 어휘에 지원되는 언어 목록을 찾을 수 있습니다. 사용자 지정 어휘에는 해당 언어의 문자 집합에 나열된 문자만 사용할 수 있다는 점에 유의하세요.
를 사용하려면 어떻게 해야 하나요?
BDA 프로젝트에서 데이터 자동화 라이브러리를 생성하고, 대상 언어에 대한 도메인별 어휘 개체/목록을 추가하고, 프로젝트 생성 중에 라이브러리를 프로젝트와 연결하거나 기존 프로젝트를 업데이트하여 해당 프로젝트를 통해 실행되는 모든 오디오 및 비디오 처리 작업이 사용자 지정 어휘를 적용할 수 있습니다. 따라서 표준 출력과 사용자 지정 블루프린트 출력 모두에서 도메인별 용어의 추출 정확도가 향상됩니다.
사용자 지정 어휘 사용 시 고려 사항:
자주 잘못 인식되는 도메인별 용어에 집중
중요한 용어의 일반적인 변형 및 철자 포함
더 나은 관리를 위해 언어별로 어휘 구성
업계별 용어 및 기술 용어의 우선 순위 지정
도메인에서 일반적으로 사용되는 약어 및 약어 포함