SageMaker 智能筛选的安全性 - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

SageMaker 智能筛选的安全性

由于 SageMaker 智能筛选库运行的是删除价值较低的训练样本的过程,因此需要在数据加载器生成训练数据集时对其进行完全访问。这种访问权限与 PyTorch 在正常训练情况下的访问权限没有什么不同。

SageMaker 智能筛选具有安全影响的内置日志功能。默认情况下,SageMaker 智能筛选日志只是包含指标、延迟以及用户错误或警告的应用程序级日志。但是,用户可以选择启用详细日志,记录完整的批次数据,以显示特定批次中删除了哪些样本。这些日志是使用 Python 日志记录器发出的,库不会上传或存储在任何地方。在自动将日志上传到 CloudWatch 或类似服务的情况下,请注意使用详细日志可能会导致敏感的训练数据被上传到训练实例之外。

除上述日志记录外,SageMaker 智能筛选没有任何网络功能,也不与本地文件系统交互。在库使用的整个过程中,用户数据都被存储为内存对象。