

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 主成分分析法 (PCA) アルゴリズム
<a name="pca"></a>

PCA は教師なし機械学習アルゴリズムで、できる限りの情報を保持しながら、データセット内の次元 (特徴の数) の縮退を試行します。これは、互いに相関しない元の特徴のコンポジットである、*成分*と呼ばれる新しい特徴のセットを見つけることで行われます。また、それらには制限が設けられているため、最初の成分はデータ内で考えられる最大の変動性、2 番目の成分は 2 番目に大きな変動性と続きます。

Amazon SageMaker AI では、PCA はシナリオに応じて次の 2 つのモードで動作します。
+ **regular**: 疎データと標準的な数の観測および特徴を備えたデータセットの場合。
+ **randomized**: 多数の観測および特徴の両方を備えたデータセットの場合。このモードは近似アルゴリズムを使用します。

PCA は表形式のデータを使用します。

行は低次元空間に組み込む観測を表します。列は減少した近似を見つける特徴を表します。アルゴリズムは共分散行列 (または分散方式での近似値) を計算し、その後このサマリーに対して特異値分解を実行して、主成分を生成します。

**Topics**
+ [PCA アルゴリズムの入出力インターフェイス](#pca-inputoutput)
+ [PCA アルゴリズムの EC2 インスタンスに関する推奨事項](#pca-instances)
+ [PCA サンプルノートブック](#PCA-sample-notebooks)
+ [PCA の仕組み](how-pca-works.md)
+ [PCA のハイパーパラメータ](PCA-reference.md)
+ [PCA のレスポンス形式](PCA-in-formats.md)

## PCA アルゴリズムの入出力インターフェイス
<a name="pca-inputoutput"></a>

PCA はトレーニングのために、トレーニングチャネルで提供されるデータを想定し、テストアルゴリズムに渡されたデータセットをオプションでサポートします。このデータセットは最終的なアルゴリズムで採点されます。トレーニングでは `recordIO-wrapped-protobuf` と `CSV` の両方の形式がサポートされます。ファイルモードまたはパイプモードを使用すると、`recordIO-wrapped-protobuf` または `CSV` の形式のデータについてモデルをトレーニングできます。

推論については、PCA は `text/csv`、`application/json`、`application/x-recordio-protobuf` に対応しています。結果は `application/json` または`application/x-recordio-protobuf` 形式のいずれかが "射影" のベクトルとともに返されます。

入出力ファイル形式の詳細については、[PCA のレスポンス形式](PCA-in-formats.md) (推論の場合) および[PCA サンプルノートブック](#PCA-sample-notebooks)を参照してください。

## PCA アルゴリズムの EC2 インスタンスに関する推奨事項
<a name="pca-instances"></a>

PCA は、トレーニングと推論用の CPU インスタンスと GPU インスタンスをサポートします。最もパフォーマンスの高いインスタンスタイプは、入力データの仕様に大きく依存します。GPU インスタンスの場合、PCA は P2、P3、G4dn、G5 をサポートします。

## PCA サンプルノートブック
<a name="PCA-sample-notebooks"></a>

SageMaker AI 主成分分析法アルゴリズムを使用して MNIST データセット内の 0～9 の手書き数字のイメージを分析する方法を示すサンプルノートブックについては、「[An Introduction to PCA with MNIST](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/pca_mnist/pca_mnist.html)」を参照してください。SageMaker AI でサンプルを実行するために使用できる Jupyter ノートブックインスタンスを作成してアクセスする方法の詳細については、「[Amazon SageMaker ノートブックインスタンス](nbi.md)」を参照してください。ノートブックインスタンスを作成して開いたら、**[SageMaker AI サンプル]** タブを選択して、すべての SageMaker AI サンプルのリストを表示します。NTM アルゴリズムを使用したトピックモデリングのサンプルノートブックは、[**Introduction to Amazon algorithm (Amazon アルゴリズムの概要)**] セクションにあります。ノートブックを開くには、その [**Use (使用)**] タブをクリックして [**Create copy (コピーを作成)**] を選択します。