기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS HealthOmics란 무엇인가요?
AWS HealthOmics 는 생물 정보학자, 연구원 및 과학자와 같은 사용자가 유전체학 및 기타 생물학적 데이터에서 인사이트를 저장, 쿼리, 분석 및 생성할 수 있도록 지원하는 AWS 서비스입니다. 연구 및 임상 조직을 위한 유전체 정보의 저장 및 분석 프로세스를 간소화하고 가속화하며 과학적 발견 및 인사이트 생성을 더 빠르게 만듭니다.
HealthOmics에는 세 가지 기본 구성 요소가 있습니다. HealthOmics Storage를 사용하면 페타바이트의 유전체학 데이터를 기가베이스당 저렴한 비용으로 효율적으로 저장하고 공유할 수 있습니다. HealthOmics Analytics는 멀티오믹스 및 멀티모달 분석을 위해 게놈 데이터를 준비하는 방법을 간소화합니다. HealthOmics 워크플로는 생물 정보학 계산을 위한 기본 인프라를 자동으로 프로비저닝하고 확장합니다.
주제
중요 공지 사항
HealthOmics는 전문적인 의학적 조언, 진단 또는 치료를 대체하지 않으며 질병 또는 건강 상태를 치료, 치료, 완화, 예방 또는 진단하기 위한 것이 아닙니다. 사용자는 임상 의사 결정을 알리기 위한 타사 제품과 관련된 경우를 AWS HealthOmics포함하여의 사용의 일부로 인적 검토를 도입할 책임이 있습니다.
HealthOmics는 데이터 전송, 저장, 형식 지정 또는 표시와 워크플로 관리를 위한 인프라 및 구성 지원 제공에만 사용됩니다. AWS HealthOmics 는 변형 호출 또는 유전체 분석 및 해석을 직접 수행하기 위한 것이 아닙니다. AWS HealthOmics 는 임상 실험실 테스트 또는 기타 디바이스 데이터, 결과 및 결과를 해석하거나 분석하기 위한 것이 아니며 유전체 분석에 사용하기 위한 타사 도구를 대체하지 않습니다.
HealthOmics 개념
이 주제에서는이 가이드에서 사용한 HealthOmics의 용어를 이해하는 데 도움이 되도록 HealthOmics와 관련된 주요 개념 및 용어에 대한 정의를 다룹니다.
스토리지
데이터 스토리지는 유전체 시퀀스 및 관련 정보에 대한 시퀀스 저장소와 모든 참조 유전체에 대한 참조 저장소로 구분됩니다. 다음 용어는 HealthOmics와 관련된 구현을 설명합니다.
-
시퀀스 스토어 - 게놈 파일을 저장하기 위한 데이터 스토어입니다. HealthOmics 내에 시퀀스 스토어를 하나 이상 보유할 수 있습니다. 시퀀스 스토어에서 액세스 권한 및 AWS KMS 암호화를 설정하여 데이터에 액세스할 수 있는 사용자를 제어할 수 있습니다.
-
읽기 세트 - 읽기 세트는 FASTQ, BAM 또는 CRAM 형식으로 저장되는 게놈 읽기의 추상화입니다. 읽기 세트는 시퀀스 저장소로 가져오고 메타데이터로 주석을 달 수 있습니다. 속성 기반 액세스 제어(ABAC)를 사용하여 읽기 세트에 권한을 적용할 수 있습니다.
-
참조 - 유전체 참조는 유전체에서 특정 읽기 또는 읽기 그룹이 매핑되는 위치를 식별하기 위해 읽기와 함께 사용됩니다. FASTA 형식이며 참조 스토어에 저장됩니다.
-
참조 스토어 - 참조 유전체의 저장을 위한 데이터 스토어입니다. 각 계정 및 리전에 단일 참조 저장소를 가질 수 있습니다.
분석
HealthOmics Analytics를 사용하여 게놈 데이터를 변환하고 분석할 수 있습니다. 변형 저장소 또는 주석 저장소를 생성하여 쿼리에 대한 추가 정보를 포함합니다.
-
변형 저장소 - 변형 데이터를 모집단 규모로 저장하는 데이터 저장소입니다. 변형 저장소는 게놈 변형 호출 형식(gVCF)과 VCF 입력을 모두 지원합니다.
-
주석 저장소 - TSV/CSV, VCF 또는 일반 기능 형식(GFF3) 파일의 주석 데이터베이스와 같은 주석 데이터베이스를 나타내는 데이터 저장소입니다. 주석 저장소는 가져오기 중에 변형 저장소와 동일한 좌표계에 매핑됩니다.
워크플로
HealthOmics 워크플로를 사용하면 게놈 데이터를 처리하고 분석할 수 있습니다.
-
워크플로 - 파라미터 및 도구에 대한 참조를 포함한 엔드 투 엔드 프로세스의 전체 정의입니다. 워크플로 정의는 WDL, Nextflow 또는 CWL로 표현할 수 있습니다. 생성된 각 워크플로에는 고유한 식별자가 있습니다.
-
실행 - 워크플로의 단일 호출입니다. 개별 실행은 정의된 입력 데이터를 사용하고 출력을 생성합니다. 생성된 각 실행에는 고유한 식별자가 있습니다.
-
작업 - 실행 내의 개별 프로세스입니다. HealthOmics 워크플로는 이러한 정의된 컴퓨팅 사양을 사용하여 작업을 실행합니다. 각 작업에는 고유한 식별자가 있습니다.
-
실행 그룹 - 최대 vCPU, 최대 기간 또는 최대 동시 실행을 설정하여 실행당 사용되는 컴퓨팅 리소스를 제한할 수 있는 실행 그룹입니다. 실행 그룹 내에서 실행에 대한 우선 순위를 지정하고 구성할 수 있습니다. 예를 들어 우선 순위가 낮은 실행보다 우선 순위가 높은 실행을 수행하여 우선 순위 대기열을 생성하도록 지정할 수 있습니다. 실행 그룹을 사용하는 것은 선택 사항이며 각 실행 그룹에는 고유한 식별자가 있습니다.
HealthOmics 기능
HealthOmics는 다음과 같은 기능을 제공합니다.
-
HealthOmics 스토리지 - 페타바이트의 원시 게놈 데이터를 기가베이스당 저렴한 비용으로 효율적으로 저장하고 공유할 수 있습니다.
-
HealthOmics Analytics - 멀티오믹스 및 멀티모달 분석을 위해 게놈 데이터를 준비하는 방법을 간소화합니다.
-
HealthOmics 워크플로 - 생물 정보학 워크플로의 기본 인프라를 자동으로 프로비저닝하고 확장합니다.
각 구성 요소를 독립적으로 사용하거나 통합 end-to-end 솔루션의 일부로 사용할 수 있습니다.
HealthOmics는 다음과 같은 이점을 제공합니다.
-
게놈 데이터를 안전하게 저장하고 결합 - HealthOmics는 및 Amazon Athena와 같은 AWS Lake Formation 다른 AWS 서비스와 통합됩니다. 더 나은 진단 및 개인 맞춤형 치료 계획을 위해 게놈 데이터를 안전하게 저장한 다음 이를 쿼리하거나 의료 기록 데이터와 결합할 수 있습니다.
-
환자 개인 정보 보호 - HealthOmics는 HIPAA 적격입니다. 또한 IAM 및 Amazon CloudWatch와 통합되어 데이터 액세스를 제어 및 로깅하고 데이터가 분석에 사용되는 방식을 추적할 수 있습니다.
-
확장 가능 — 간소화된 결제 및 새로운 협업 도구를 통해 대규모 모집단 데이터 분석을 지원합니다.
-
효율성 극대화 - 자동화된 워크플로와 통합 도구를 사용하여 데이터 처리 및 분석을 간소화합니다.
다음과 같은 생체의학 애플리케이션에 HealthOmics를 사용할 수 있습니다.
-
모집단 시퀀싱 - 수천 개의 유전체를 한 번에 쿼리하여 유전체 변형이 모집단 전체의 생체 인식에 매핑되는 방식을 이해합니다.
-
임상 게놈 - 시퀀서 출력에서 보고 가능한 데이터에 이르기까지 재현 가능한 게놈 워크플로를 구축합니다. 또한 대량 처리량을 최적화하고 우선 순위가 높은 임상 샘플에 대한 컴퓨팅 요구 사항을 설정하여 처리 시간을 줄일 수 있습니다.
-
임상 실험 - 게놈 분석을 임상 실험에 통합하여 새로운 약물 후보의 유효성을 더 잘 이해합니다. 장기 비용 절감 및 데이터 출처를 통해 임상 시험을 간소화하고 가속화하여 관리 기관의 규정을 충족합니다.
-
연구 및 혁신 향상 - 기본 제공 행 및 열 기반 액세스 제어를 사용하여 익명화된 게놈 데이터의 스토리지, 액세스 및 분석을 간소화하고 제어합니다.
관련 서비스
다음 서비스는 HealthOmics에서 작동합니다.
-
Amazon Elastic Container Registry - 각 프라이빗 워크플로는 Amazon ECR 이미지(프라이빗 Amazon ECR 리포지토리)를 사용하여 워크플로를 실행하는 데 필요한 모든 실행 파일, 라이브러리 및 스크립트를 포함합니다.
-
Amazon Simple Storage Service – Amazon S3는 저장 및 워크플로 데이터를 위한 파일 스토리지를 제공합니다.
-
AWS Lake Formation - Lake Formation은 Analytics 데이터 스토어에 대한 데이터 액세스를 관리합니다.
-
Amazon Athena - Athena를 사용하여 변형 저장소에 대한 쿼리를 수행합니다.
-
Amazon SageMaker AI - SageMaker AI를 사용하여 Jupyter 노트북을 사용하여 HealthOmics 작업을 실행합니다.
AWS HealthOmics의 리전 및 엔드포인트
리전 및 엔드포인트의 전체 목록은 AWS 일반 참조를 참조하세요.
기본적으로 활성 상태인 AWS 리전 외에도 활성화해야 하는 옵트인 리전도 있습니다. 리전을 활성화하거나 비활성화하는 방법에 대한 자세한 내용은 AWS 계정 관리 안내서의 계정에서 사용할 수 있는 AWS 리전 지정을 참조하세요.
HealthOmics에 액세스하는 방법
관리 콘솔, CLI, SDKs 또는 API를 사용하여 AWS HealthOmics 기능에 액세스할 수 있습니다.
-
AWS 관리 콘솔 - HealthOmics에 액세스하는 데 사용할 수 있는 웹 인터페이스를 제공합니다.
-
AWS Command Line Interface (AWS CLI) - Windows, macOS AWS HealthOmics및 Linux를 포함하여 다양한 AWS 서비스에 대한 명령을 제공합니다. 설치에 대한 자세한 내용은 단원을 AWS CLI참조하십시오AWS Command Line Interface
. -
AWS SDKs- 다양한 프로그래밍 언어 및 플랫폼(Java, Python, Ruby, .NET, iOS 및 Android 포함)을 위한 라이브러리 및 샘플 코드로 구성된 SDKs(소프트웨어 개발 키트)를 AWS 제공합니다. SDKs는 프로그래밍 방식으로 HealthOmics를 사용하는 편리한 방법을 제공합니다. 자세한 내용은 AWS SDK 개발자 센터를
참조하세요. -
AWS API - API 작업을 사용하여 HealthOmics에 프로그래밍 방식으로 액세스하고 관리할 수 있습니다. 자세한 내용은 HealthOmics API 참조를 참조하세요.
자세히 알아보기
다음 워크숍 및 자습서에서 HealthOmics에 대해 자세히 알아보세요.
-
HealthOmics 워크숍 - HealthOmics 엔드 투 엔드 워크숍
-
AWS 게놈 리소스 - 게놈과 관련된 퍼블릭 Amazon ECR 리포지토리
-
Python 자습서 - HealthOmics 스토리지, 분석 및 워크플로를 다루는 GitHub의 Jupyter 노트북 자습서
다음을 AWS 제공하는 추가 HealthOmics 도구에 익숙해지세요.
-
WDL 린터 - WDL용 HealthOmics 린터
-
Nextflow linter – Nextflow용 HealthOmics linter
-
HealthOmics Amazon ECR 헬퍼 도구 - HealthOmics용 Amazon ECR 헬퍼 도구
-
GitHub의 HealthOmics 도구 - HealthOmics 작업 도구
(전송 관리자, URI 구문 분석기, Omics 재실행, 분석기 실행).