内容领域 2:ML 模型开发
任务 2.1:选择建模方法
掌握以下知识:
ML 算法的功能以及正确用于解决业务问题
如何使用 AWS 人工智能 (AI) 服务(例如,Amazon Translate、Amazon Transcribe、Amazon Rekognition、Amazon Bedrock)来解决特定的业务问题
在模型选择或算法选择过程中如何考虑可解释性
Amazon SageMaker AI 内置算法以及各算法的应用场景
具备以下技能:
评估可用数据和问题复杂性,以便确定 ML 解决方案的可行性
比较和选择适当的 ML 模型或算法来解决特定问题
选择内置算法、基础模型和解决方案模板(例如,在 SageMaker JumpStart 和 Amazon Bedrock 中)
根据成本选择模型或算法
选择 AI 服务来解决常见的业务需求问题
任务 2.2:训练和优化模型
掌握以下知识:
训练过程中的要素(例如,epoch、步骤、批次大小)
缩短模型训练时间的方法(例如,提前停止、分布式训练)
影响模型大小的因素
提高模型性能的方法
正则化技术的益处(例如,随机失活、权重衰减、L1 和 L2)
超参数优化技术(例如,随机搜索、贝叶斯优化)
模型超参数及其对模型性能的影响(例如,基于树的模型中的树数量、神经网络中的层数)
将在 SageMaker AI 之外构建的模型集成到 SageMaker AI 中的方法
具备以下技能:
使用 SageMaker AI 内置算法和常用 ML 库开发 ML 模型
使用 SageMaker AI 脚本模式和支持 SageMaker AI 的框架来训练模型(例如 TensorFlow、PyTorch)
使用自定义数据集微调预训练模型(例如 Amazon Bedrock、SageMaker JumpStart)
执行超参数优化(例如,使用 SageMaker AI 自动模型优化 [AMT])
集成自动超参数优化功能
防止模型过拟合、欠拟合和灾难性遗忘(例如,通过使用正则化技术、特征选择)
组合多个训练模型以提高性能(例如,集成、堆叠、提升)
减小模型大小(例如,通过更改数据类型、修剪、更新特征选择、压缩)
管理模型版本来实现可重复性以及用于审计(例如,使用 SageMaker 模型注册表)
任务 2.3:分析模型性能
掌握以下知识:
模型评估技术和指标(例如,混淆矩阵、热图、F1 分数、准确率、查准率、查全率、均方根误差 [RMSE]、接收方操作特性 [ROC]、ROC 曲线下面积 [AUC])
创建性能基准的方法
识别模型过拟合和欠拟合的方法
SageMaker Clarify 中提供的指标,用于深入了解 ML 训练数据和模型
收敛问题
具备以下技能:
选择和解释评估指标并检测模型偏差
评估在模型性能、训练时间和成本之间的权衡
使用 AWS 服务执行可重复的实验
将影子变体的性能与生产变体的性能进行比较
使用 SageMaker Clarify 解释模型输出
使用 SageMaker 模型调试器调试模型收敛