内容领域 2:ML 模型开发 - AWS Certified Machine Learning Engineer

内容领域 2:ML 模型开发

任务 2.1:选择建模方法

掌握以下知识:

  • ML 算法的功能以及正确用于解决业务问题

  • 如何使用 AWS 人工智能 (AI) 服务(例如,Amazon Translate、Amazon Transcribe、Amazon Rekognition、Amazon Bedrock)来解决特定的业务问题

  • 在模型选择或算法选择过程中如何考虑可解释性

  • Amazon SageMaker AI 内置算法以及各算法的应用场景

具备以下技能:

  • 评估可用数据和问题复杂性,以便确定 ML 解决方案的可行性

  • 比较和选择适当的 ML 模型或算法来解决特定问题

  • 选择内置算法、基础模型和解决方案模板(例如,在 SageMaker JumpStart 和 Amazon Bedrock 中)

  • 根据成本选择模型或算法

  • 选择 AI 服务来解决常见的业务需求问题

任务 2.2:训练和优化模型

掌握以下知识:

  • 训练过程中的要素(例如,epoch、步骤、批次大小)

  • 缩短模型训练时间的方法(例如,提前停止、分布式训练)

  • 影响模型大小的因素

  • 提高模型性能的方法

  • 正则化技术的益处(例如,随机失活、权重衰减、L1 和 L2)

  • 超参数优化技术(例如,随机搜索、贝叶斯优化)

  • 模型超参数及其对模型性能的影响(例如,基于树的模型中的树数量、神经网络中的层数)

  • 将在 SageMaker AI 之外构建的模型集成到 SageMaker AI 中的方法

具备以下技能:

  • 使用 SageMaker AI 内置算法和常用 ML 库开发 ML 模型

  • 使用 SageMaker AI 脚本模式和支持 SageMaker AI 的框架来训练模型(例如 TensorFlow、PyTorch)

  • 使用自定义数据集微调预训练模型(例如 Amazon Bedrock、SageMaker JumpStart)

  • 执行超参数优化(例如,使用 SageMaker AI 自动模型优化 [AMT])

  • 集成自动超参数优化功能

  • 防止模型过拟合、欠拟合和灾难性遗忘(例如,通过使用正则化技术、特征选择)

  • 组合多个训练模型以提高性能(例如,集成、堆叠、提升)

  • 减小模型大小(例如,通过更改数据类型、修剪、更新特征选择、压缩)

  • 管理模型版本来实现可重复性以及用于审计(例如,使用 SageMaker 模型注册表)

任务 2.3:分析模型性能

掌握以下知识:

  • 模型评估技术和指标(例如,混淆矩阵、热图、F1 分数、准确率、查准率、查全率、均方根误差 [RMSE]、接收方操作特性 [ROC]、ROC 曲线下面积 [AUC])

  • 创建性能基准的方法

  • 识别模型过拟合和欠拟合的方法

  • SageMaker Clarify 中提供的指标,用于深入了解 ML 训练数据和模型

  • 收敛问题

具备以下技能:

  • 选择和解释评估指标并检测模型偏差

  • 评估在模型性能、训练时间和成本之间的权衡

  • 使用 AWS 服务执行可重复的实验

  • 将影子变体的性能与生产变体的性能进行比较

  • 使用 SageMaker Clarify 解释模型输出

  • 使用 SageMaker 模型调试器调试模型收敛