机器学习(ML)和人工智能(AI)
AWS 通过最全面的机器学习服务和专门构建的基础设施,在机器学习采用过程的每个阶段为您提供帮助。我们经过预先训练的人工智能服务能够为您的应用程序和工作流提供现成的智能技术。
示意图后面有每项服务的描述。为了帮助您确定哪种服务最能满足您的需求,请参阅选择 AWS 机器学习服务、选择生成式人工智能服务以及 Amazon Bedrock 或 Amazon SageMaker AI?。有关一般信息,请参阅在 AWS 上构建和扩展下一波人工智能创新。
返回 AWS 服务。
Amazon Augmented AI
Amazon Augmented AI(Amazon A2I)是一项机器学习服务,可以轻松构建人工审核所需的工作流。无论是否在 AWS 上运行,Amazon A2I 使所有开发人员都能使用人工审核,消除了与构建人工审核系统或管理大量人工审核人员相关的千篇一律的繁重工作。
Amazon Bedrock
Amazon Bedrock 是一项完全托管式服务,可通过 API 提供来自 Amazon 和其他领先人工智能公司的基础模型(FM)。借助 Amazon Bedrock 无服务器体验,您可以快速入门、试用 FM、使用自己的数据进行量身定制,以及将 FM 无缝集成和部署到您的 AWS 应用程序中。
您可以从领先的人工智能公司的各种基础模型中进行选择,例如 AI21 Labs、Anthropic、Cohere、DeepSeek、Luma、Meta、Mistral AI 和 Stability AI。或者,您也可以使用 Amazon Bedrock 独家提供的 Amazon Nova 基础模型。
Amazon CodeGuru
Amazon CodeGuru 是一款开发人员工具,可提供智能建议以提高代码质量,并识别应用程序中开销最高的代码行。将 CodeGuru 集成到您现有的软件开发工作流中,以便在应用程序开发期间自动进行代码审查,持续监控应用程序在生产中的性能,并就如何提高代码质量、应用程序性能和降低总体成本提供建议和可视化线索。
Amazon CodeGuru Reviewer 使用机器学习和自动推理来识别应用程序开发过程中的关键问题、安全漏洞以及难以发现的错误,并提供可提高代码质量的建议。
Amazon CodeGuru Profiler 通过帮助开发人员了解应用程序的运行时行为、识别和消除代码效率低下、提高性能并显著降低计算成本,帮助他们找到应用程序中开销最大的代码行。
Amazon Comprehend
Amazon Comprehend 使用机器学习和自然语言处理(NLP)帮助您发现非结构化数据中的见解和关系。该服务能够识别文本语言;提取关键短语、地点、人物、品牌或事件;判断文本的积极或消极程度;通过分词和词性标注分析文本;并按主题自动整理文本文件集。您还可以使用 Amazon Comprehend 中的 AutoML 功能来构建一组专为您的组织需求量身定制的自定义实体或文本分类模型。
要从非结构化文本中提取复杂的医疗信息,您可以使用 Amazon Comprehend Medical。该服务可以从各种来源(例如医生笔记、临床试验报告和患者健康记录)中识别医疗信息,例如医疗状况、药物、剂量、规格和频率。为了便于分析,Amazon Comprehend Medical 还会识别提取的药物与检测、治疗方案和诊疗操作信息之间的关系。例如,该服务可从非结构化的临床记录中确定与特定药物相关的特定剂量、规格和频率。
Amazon DevOps Guru
Amazon DevOps Guru 是由机器学习支持的服务,可轻松提高应用程序的运行性能和可用性。Amazon DevOps Guru 会检测到偏离正常操作模式的行为,因此可尽早识别运行问题,以免影响客户。
Amazon DevOps Guru 使用以 Amazon.com AWS 多年的经验和卓越运营为基础的机器学习模型来识别异常应用程序行为(例如延迟增加、错误率、资源限制等),并揭示可能导致潜在中断或服务中断的关键问题。当 Amazon DevOps Guru 发现重大问题时,它会自动发送警报,并提供相关异常的摘要、可能的根本原因以及问题发生的时间和地点等背景信息。在可能的情况下,Amazon DevOps Guru 还会就如何修复问题提供建议。
Amazon DevOps Guru 会自动从 AWS 应用程序提取数据,并提供单一控制面板,用于直观呈现运行数据中的问题。首先,您可以为 AWS 账户中的所有资源、CloudFormation 堆栈中的资源或按 AWS 标签分组的资源启用 Amazon DevOps Guru,无需执行手动设置或具备机器学习专业知识。
Amazon Forecast
Amazon Forecast 是一种完全托管式服务,可使用机器学习提供高度精确的预测。
当今的公司尝试使用从简单电子表格到复杂财务规划软件的一切工具来准确预测未来的业务成果,例如产品需求、资源需求或财务业绩。这些工具通过查看一系列历史数据(称为时间序列数据)来构建预测。例如,此类工具可能会尝试通过仅查看之前的雨衣销售数据来预测雨衣的未来销量,其基本假设是未来由过去决定。这种方法很难对趋势无规则的大量数据进行准确的预测。此外,它无法便捷地将随时间推移而变化的数据序列(例如价格、折扣、网络流量和员工人数)与相关的自变量(例如产品特征和商店位置)结合起来。
基于 Amazon.com 使用的相同技术,Amazon Forecast 使用机器学习将时间序列数据与其他变量相结合来建立预测。Amazon Forecast 不要求您具备任何机器学习经验即可开始使用。您只需要提供历史数据,以及您认为可能影响预测的任何其他数据。例如,对特定颜色的衬衫的需求可能会随着季节和商店位置的变化而有所不同。这种复杂的关系很难单独确定,但是机器学习非常适合识别这种关系。在您提供数据后,Amazon Forecast 将自动对其进行检查,确定哪些数据有意义,并生成一个预测模型,该模型能够做出准确性比单独查看时间序列数据高出 50% 的预测。
Amazon Forecast 是一项完全托管式服务,因此无需预置服务器,也无需构建、训练或部署机器学习模型。您只需按您的实际用量付费;既没有最低费用,也无需预付费。
Amazon Fraud Detector
Amazon Fraud Detector 是一项完全托管式服务,它使用机器学习和 Amazon 20 多年的欺诈检测专业知识来识别潜在欺诈活动,以便客户可以更快地发现更多在线欺诈行为。构建、训练和部署用于欺诈检测的机器学习模型耗时且开销高昂,Amazon Fraud Detector 可自动执行整个过程,从而使客户更容易利用该技术。Amazon Fraud Detector 会根据客户自己的数据集量身定制每个模型,使模型的准确性高于当前的“一刀切”式机器学习解决方案。而且,由于您只需按实际用量付费,可以避免大量前期费用。
Amazon Comprehend Medical
在过去十年中,AWS 见证了健康领域的数字化转型,各组织每天都会捕获到大量患者信息。但是这些数据通常是非结构化的,提取这些信息的过程耗时耗力,而且容易出错。Amazon Comprehend Medical 是一种符合 HIPAA 要求的自然语言处理(NLP)服务,该服务经过预先训练,可通过机器学习从医疗文本(如处方、程序或诊断)中理解和提取健康数据。Amazon Comprehend Medical 可以帮助您使用 ICD-10-CM、RxNorm 和 SNOMED CT 等医学本体准确、快速地从非结构化医学文本中提取信息,进而加快保险索赔处理、改善人群健康状况并加快药物警戒进程。
Amazon Kendra
Amazon Kendra 是一项由机器学习提供支持的智能搜索服务。Amazon Kendra 可为您的网站和应用程序重塑企业级搜索体验,使您的员工和客户可以轻松找到他们要查找的内容,即使这些内容分散在组织内的多个位置和内容存储库中。
借助 Amazon Kendra,您无需在海量非结构化数据中逐一检索,即可在需要时快速获取问题的精准答案。Amazon Kendra 是一项完全托管式服务,因此无需预置服务器,也无需构建、训练或部署机器学习模型。
Amazon Lex
Amazon Lex 是一种完全托管式人工智能(AI)服务,可用于在任何应用程序中设计、构建、测试和部署使用语音和文本的对话接口。Lex 提供高级的自动语音识别(ASR)深度学习功能,可以将语音转换为文本,还提供自然语言理解(NLU)功能,可以识别文本的意图,让您能够构建用户体验极具吸引力且会话交互逼真的应用程序。借助 Amazon Lex,任何开发人员均可使用 Amazon Alexa 所用的深度学习技术,从而使您能够快速轻松地构建高级自然语言对话机器人(“聊天机器人”)和支持语音的交互式语音应答(IVR)系统。
借助 Amazon Lex,开发人员能够快速构建对话聊天机器人。借助 Amazon Lex,无需深度学习专业知识,您只需在 Amazon Lex 控制台中指定基本对话流程即可创建机器人。Amazon Lex 管理对话并在对话中动态调整响应。借助此控制台,您可构建、测试和发布您的文本或语音聊天自动程序。随后,您可将对话接口添加到移动设备、Web 应用程序和聊天平台(例如,Facebook Messenger)上的自动程序。使用 Amazon Lex 无需支付预付费用或最低费用,仅对实际产生的文本请求或语音请求计费。基于请求的即付即用定价和低成本使这项服务成为构建对话接口的经济高效的方式。通过 Amazon Lex 免费套餐,您可轻松试用 Amazon Lex,无需任何初期投资。
Amazon Lookout for Equipment
Amazon Lookout for Equipment 会分析来自设备传感器的数据(例如发电机中的压力、压缩机的流量、风扇每分钟转数),从而仅根据您的数据自动为您的设备训练机器学习模型,您无需具备机器学习专业知识。Lookout for Equipment 使用您独特的机器学习模型实时分析传入的传感器数据,并准确识别可能导致机器故障的预警信号。这意味着您可以快速而精确地检测设备异常,快速诊断问题,采取措施缩短代价高昂的停机时间,并减少错误警报。
Amazon Lookout for Metrics
Amazon Lookout for Metrics 使用机器学习来自动检测和诊断业务数据及运营数据中的异常情况(即偏离正常基准的异常值),例如销售收入或客户获取率的突然下降。只需点击几下,您就可以将 Amazon Lookout for Metrics 连接到热门的数据存储服务,例如 Amazon S3、Amazon Redshift 和 Amazon Relational Database Service(Amazon RDS),以及第三方软件即服务(SaaS)应用程序,例如 Salesforce、Servicenow、Zendesk 和 Marketo,并开始监控对您的业务很重要的指标。与用于异常检测的传统方法相比,Lookout for Metrics 会自动检查和准备来自这些来源的数据,以更快、更准确地检测异常。您还可以针对检测到的异常提供反馈,以调整结果并不断提高准确性。Lookout for Metrics 可以将与同一事件相关的异常分到一组,然后发送包含潜在根本原因摘要的警报,从而轻松诊断检测到的异常。它还会按严重程度对异常进行排名,以便您可以将注意力优先放在对业务最重要的数据上。
Amazon Lookout for Vision
Amazon Lookout for Vision 是一项机器学习服务,使用计算机视觉(CV)发现视觉表示中的缺陷和异常。借助 Amazon Lookout for Vision,制造企业能够通过大规模快速识别物体图像中的差异,提升产品质量并降低运营成本。例如,Lookout for Vision 可以识别产品中缺失的组件、车辆或结构损坏、生产线异常、硅芯片中的微小缺陷,以及其他类似问题。Amazon Lookout for Vision 使用机器学习,能够像人一样观察并理解来自任意摄像头的图像,且具备更高的准确率和更大的检测规模。借助 Lookout for Vision,客户可以省去进行成本高昂且结果不一致的人工检测环节,同时在质量控制、缺陷与损坏评估及合规性管理方面实现优化提升。只需几分钟,您就可以开始使用 Lookout for Vision 自动检查图像和物体,无需具备机器学习专业知识。
Amazon Monitron
Amazon Monitron 是一个端到端系统,使用机器学习检测工业机械中的异常行为,使您能够实施预测性维护并缩短计划外停机时间。
安装传感器以及用于数据连接、存储、分析和警报的必要基础设施是实现预测性维护的基本要素。然而在过去,为了使其发挥作用,各公司往往需要熟练的技术人员和数据科学家从零开始搭建一套复杂的解决方案。这包括确定和采购适合其使用案例的传感器类型,并将它们与物联网网关(一种聚合和传输数据的设备)连接在一起。因此,很少有公司能够成功实施预测性维护。
Amazon Monitron 中涵盖了用于捕获设备振动和温度数据的传感器、用于安全将数据传输到 AWS 的网关设备、使用机器学习分析数据中是否存在异常机器模式的 Amazon Monitron 服务,以及用于设置设备并接收操作行为报告和机器潜在故障警报的配套移动应用程序。您无需具备任何开发工作或机器学习经验,几分钟内就能开始监控设备运行状况,并运用 Amazon 运营中心所用的设备监控技术来实现预测性维护。
Amazon PartyRock
Amazon PartyRock 借助实操型无代码应用程序构建器,让生成式人工智能的学习过程变得轻松简单。您可以在创建和探索趣味应用程序的同时,实践提示工程技巧、查看生成的响应,并逐步培养对生成式人工智能的直觉认知。PartyRock 通过 Amazon Bedrock(一项完全托管式服务),提供对来自 Amazon 及顶尖人工智能企业的基础模型(FM)的访问权限。
Amazon Personalize
Amazon Personalize 是一项机器学习服务,使开发人员能够轻松为使用其应用程序的客户创建个性化推荐。
机器学习越来越多地用于通过提供个性化的产品和内容推荐、量身定制的搜索结果和有针对性的营销促销来提高客户参与度。但是,由于开发机器学习功能的复杂性,开发制作这些复杂的推荐系统所必需的机器学习能力已超出了当今大多数组织的能力。借助 Amazon Personalize,以前没有机器学习经验的开发人员能够使用 Amazon.com 多年实践打磨的成熟机器学习技术,轻松在其应用中集成复杂的个性化推荐能力。
借助 Amazon Personalize,您可以提供应用程序中的活动流(页面浏览量、注册次数、购买次数等)以及您想要推荐的商品(例如文章、产品、视频或音乐)的清单。您也可以选择向 Amazon Personalize 提供用户的其他人口统计信息,例如年龄或地理位置。Amazon Personalize 能够处理和检查数据,确定有意义的数据,选择正确的算法,训练和优化针对您的数据定制的个性化模型。
Amazon Personalize 为零售、媒体和娱乐行业提供经过优化的推荐工具,可以更快、更轻松地提供高性能的个性化用户体验。此外,Amazon Personalize 还提供智能用户细分,让您能够通过营销渠道开展更有效的潜在客户活动。借助我们的两个新配方,您可以根据用户对不同产品类别、品牌等的兴趣自动对其进行细分。
Amazon Personalize 分析的所有数据都保密且安全,并且仅用于您的定制推荐。您可以从该服务所维护的虚拟私有云内部通过简单的 API 调用开始提供个性化预测。您只需按您的实际用量付费;既没有最低费用,也无需预付费。
Amazon Personalize 就如同为您配备了一支专属 Amazon.com 机器学习个性化团队,全天候为您服务。
Amazon Polly
Amazon Polly 是一项可将文本转化为逼真语音的服务。Amazon Polly 支持您创建会说话的应用程序,使您能够构建支持语音的全新产品。Amazon Polly 是 Amazon 的一项人工智能(AI)服务,使用先进的深度学习技术来合成听起来像人声的语音。Amazon Polly 提供涵盖数十种语言的丰富拟真语音库,您可按需选择理想的语音风格,以便可以轻松构建支持多个国家/地区使用的语音交互应用程序。
Amazon Polly 提供支持实时交互式对话所需的持续快速响应时间。您可以缓存并保存 Amazon Polly 语音音频,以便离线重播或重新分发。并且,Amazon Polly 易于使用。您只需将要转换为语音的文本发送到 Amazon Polly API,Amazon Polly 就会立即将音频流返回到您的应用程序,这样您的应用程序就可以直接播放或以 MP3 等标准音频文件格式存储音频流。
除了标准 TTS 语音外,Amazon Polly 还提供神经文本到语音(NTTS)语音,通过全新机器学习方案,实现语音质量的突破性提升。Polly 的神经 TTS 技术还支持播音员风格,专为新闻播报使用案例量身定制。最后,Amazon Polly 品牌语音还可以为企业打造定制语音。这是一项定制服务,您将与 Amazon Polly 团队合作,构建 NTTS 语音,仅供您的企业独家使用。
使用 Amazon Polly,您只需按转换为语音的字符数付费,并且可以保存和重播 Amazon Polly 生成的语音。Amazon Polly 每字符转换成本低廉,而且对语音输出的存储和重复使用没有限制,是一种经济高效的方案,让您在任何地方都能将文字转换为语音。
Amazon Q
Amazon Q 是一款生成式人工智能驱动的助手,用于加速软件开发并利用您的内部数据。
- Amazon Q Business
-
Amazon Q Business 可以根据企业系统中的数据和信息回答问题、提供摘要、生成内容并安全地完成任务,它可以赋能员工,提升员工的创造力、数据驱动思维、工作效率、业务准备度与产出效能。
- Amazon Q Developer
-
Amazon Q 开发者版(前身为 Amazon CodeWhisperer)可协助开发人员和 IT 专业人员完成任务,这些任务包括编码、测试和升级应用程序,以及诊断错误、执行安全扫描和修复及优化 AWS 资源,等等。Amazon Q 具有多步骤规划和推理相关的高级功能,可以转换现有代码(例如,执行 Java 版本升级),并实施根据开发人员请求生成的新功能。
Amazon Rekognition
Amazon Rekognition 使用久经考验、高度可扩展的深度学习技术,无需具备机器学习专业知识,即可轻松地将图像和视频分析添加到应用程序中。借助 Amazon Rekognition,您可以识别图像和视频中的物体、人物、文本、场景和活动,以及检测任何不当内容。Amazon Rekognition 还提供高度精确的面部分析和面部搜索功能,可用于检测、分析和比较不同人脸,以用于各种用户验证、人员计数和公共安全使用案例。
借助 Amazon Rekognition Custom Labels,您可以根据自己的业务需求识别图像中的物体和场景。例如,您可以构建一个模型来对装配线上的特定机器零件进行分类或检测运行状况不佳的工厂。Amazon Rekognition Custom Labels 承担了模型开发的繁重工作,因此您无需具备任何机器学习经验。您只需要提供要识别的物体或场景的图像,剩下的交给该服务即可。
Amazon SageMaker AI
借助 Amazon SageMaker AI,您可以使用完全托管式基础设施、工具和工作流为任何使用案例构建、训练和部署机器学习模型。SageMaker AI 消除了机器学习流程每个步骤的繁重工作,助您更轻松地开发高质量的模型。SageMaker AI 在单个工具集中提供用于机器学习的所有组件,使模型能够以更少的工作量和更低的成本更快地投入生产。
Amazon SageMaker AI Autopilot
Amazon SageMaker AI Autopilot 可根据您的数据自动构建、训练和调整最佳机器学习模型,同时让您保持完全控制和可见性。使用 SageMaker AI Autopilot,您只需提供一个表格数据集并选择要预测的目标列,该列可以是数字(例如房价,称为回归)或类别(例如垃圾邮件/非垃圾邮件,称为分类)。SageMaker AI Autopilot 将自动探索不同的解决方案以找到最佳模型。然后,您只需单击一下即可将模型直接部署到生产环境中,或者借助 Amazon SageMaker AI Studio 对推荐的解决方案进行迭代优化,以进一步提高模型质量。
Amazon SageMaker AI Canvas
Amazon SageMaker AI Canvas 能够为业务分析师提供直观的点击式界面,降低了机器学习的门槛 - 分析师无需具备任何机器学习经验,也无需编写一行代码,即可自己生成准确的机器学习预测。
Amazon SageMaker AI Clarify
Amazon SageMaker AI Clarify 为机器学习开发人员提供了更高的训练数据和模型的深度洞察能力,帮助他们识别和减少偏差,同时实现预测结果的可解释性。Amazon SageMaker AI Clarify 通过检查您指定的属性,来检测数据准备期间、模型训练之后以及所部署模型中的潜在偏差。SageMaker AI Clarify 中还有特征重要性图表,可帮助您解释模型预测并生成报告,这些报告可用于支持内部演示或识别模型中存在的问题,帮助您采取措施纠正这些问题。
Amazon SageMaker AI 数据标注
Amazon SageMaker AI 提供数据标注服务来识别原始数据,例如图像、文本文件和视频,并添加信息标签,为您的机器学习模型创建高质量的训练数据集。
Amazon SageMaker AI Data Wrangler
Amazon SageMaker AI Data Wrangler 将汇总和准备机器学习数据所需的时间从几周缩短到了几分钟。借助 SageMaker AI Data Wrangler,您可以简化数据准备和特征工程的流程,并通过单个可视化界面完成数据准备工作流的每个步骤,包括数据选择、清理、探索和可视化。
Amazon SageMaker AI Edge
Amazon SageMaker AI Edge 通过优化、保护模型并将其部署到边缘,然后在您的设备实例集(例如智能摄像头、机器人和其他智能电子设备)上监控这些模型,从而在边缘设备上实现机器学习,降低持续运营成本。SageMaker AI Edge Compiler 对经过训练的模型进行了优化,使其可在边缘设备上运行。SageMaker AI Edge 包括空中下载(OTA)部署机制,可帮助您独立于应用程序或设备固件在实例集上部署模型。SageMaker AI Edge 代理支持您在同一台设备上运行多个模型。该代理会根据您控制的逻辑(例如间隔)收集预测数据,然后将其上传到云端,以便您能随时间推移定期重新训练模型。
Amazon SageMaker AI Feature Store
Amazon SageMaker AI Feature Store 是一个专门构建的存储库,您可以在其中存储和访问特征,以便更轻松地跨团队对这些特征进行命名、整理和重复使用。SageMaker AI Feature Store 为训练和实时推理期间的特征提供了统一存储,无需编写额外的代码或创建手动流程即可保持特征的一致性。SageMaker AI Feature Store 会跟踪所存储特征的元数据(如特征名称或版本号等),以便您可以使用交互式查询服务 Amazon Athena,批量或实时查询这些特征的相应属性。SageMaker AI Feature Store 还会持续更新特征,因为在推理期间生成新数据时,会更新单个存储库,因此模型在训练和推理期间始终可以使用新特征。
Amazon SageMaker AI 地理空间功能
借助 Amazon SageMaker AI 地理空间功能,数据科学家和机器学习(ML)工程师能够更轻松地使用地理空间数据更快地构建、训练和部署 ML 模型。您可以访问开源和第三方数据、处理工具和可视化工具,从而更高效地为 ML 准备地理空间数据。您可以通过使用专用算法和预训练的 ML 模型来加快模型构建和训练速度,从而提高工作效率;还可以使用内置的可视化工具在交互式地图上探索预测输出,然后就洞察力和结果进行跨团队协作。
Amazon SageMaker AI HyperPod
Amazon SageMaker AI HyperPod 消除了在为大语言模型(LLM)、扩散模型和基础模型(FM)构建和优化机器学习(ML)基础设施时所涉及的无差别繁重工作。SageMaker AI HyperPod 已预先配置了分布式训练库,使客户能够自动将训练工作负载拆分到数千个加速器 [例如 AWS Trainium、NVIDIA A100 和 H100 图形处理器(GPU)] 上。
SageMaker AI HyperPod 还可以通过定期保存检查点来确保您的训练不间断。发生硬件故障时,自我修复集群会自动检测故障,修复或更换故障实例,并从上次保存的检查点恢复训练,让您无需手动管理此过程,并帮助您在分布式环境中训练数周或数月而不会中断。您可以自定义计算环境,使其最符合您的需求,并为其配置 Amazon SageMaker AI 分布式训练库,从而在 AWS 上实现最佳性能。
Amazon SageMaker AI JumpStart
Amazon SageMaker AI JumpStart 可帮助您快速轻松地开始使用机器学习。为了帮助您更轻松地入门,SageMaker AI JumpStart 为最常见的使用案例提供了一套解决方案,只需点击几下即可轻松部署。这些解决方案是完全可定制的,展示了 AWS CloudFormation 模板和参考架构的用法,帮助您加快机器学习之旅。Amazon SageMaker AI JumpStart 还支持一键式部署和微调 150 多种热门的开源模型,例如自然语言处理、物体检测和图像分类模型。
Amazon SageMaker AI 建模
Amazon SageMaker AI 提供了构建机器学习模型时所需的全部工具和库,以及迭代尝试不同算法并评估其准确性以找到最适合您的使用案例的算法的过程。在 Amazon SageMaker AI 中,您可以选择不同的算法,包括超过 15 种针对 SageMaker AI 进行了优化的内置算法,只需点击几下即可使用来自热门模型库的 750 多个预建模型。SageMaker AI 还提供各种模型构建工具,包括 Amazon SageMaker AI Studio Notebooks、JupyterLab、RStudio 和基于 Code-OSS(Virtual Studio Code 开源版)的代码编辑器,您可以在这些工具中小规模运行机器学习模型以查看结果和性能报告,从而得到高质量的工作原型。
Amazon SageMaker AI 模型训练
借助 Amazon SageMaker AI,您无需管理基础设施,因此减少了大规模训练和微调机器学习模型的时间和成本。您可以利用目前可用的最高性能的机器学习计算基础设施,并且 SageMaker AI 可以自动纵向或横向扩展基础设施,从一个 GPU 扩展到数千个 GPU。由于您只需按实际用量付费,因此可以更有效地管理训练成本。要更快地训练深度学习模型,您可以使用 Amazon SageMaker AI 分布式训练库来提高性能,也可以使用第三方库,例如 DeepSpeed、Horovod 或 Megatron。
Amazon SageMaker AI 模型部署
借助 Amazon SageMaker AI,您可以轻松部署机器学习模型,从而针对任何使用案例以最佳性价比进行预测(也称为推理)。它提供多种 ML 基础设施和模型部署选项,可帮助满足您的所有 ML 推理需求。它是一项与 MLOps 工具集成的完全托管服务,因此您可以扩展模型部署,降低推理成本,在生产中更有效地管理模型,并减轻运营负担。
Amazon SageMaker AI 管线
Amazon SageMaker AI 管线是第一项针对机器学习专门构建且易于使用的持续集成和持续交付(CI/CD)服务。借助 SageMaker AI 管线,您可以大规模创建、自动化和管理端到端机器学习工作流。
Amazon SageMaker AI Studio Lab
Amazon SageMaker AI Studio Lab 是一个免费的机器学习开发环境,为所有学习和开展机器学习实验的人员,无偿提供计算资源、存储空间(最大 15 GB)和安全保障。您只需要一个有效的电子邮件地址即可开始,无需配置基础设施、管理身份和访问权限,甚至都无需注册 AWS 账户。SageMaker AI Studio Lab 通过 GitHub 集成加速模型构建,并且预先配置了最热门的机器学习工具、框架和库,让您立即开始使用。SageMaker AI Studio Lab 会自动保存您的工作,因此每次会话结束时无需重新开始。简单到就像合上笔记本电脑,后续回来即可无缝接续工作一样。
Apache MXNet on AWS
Apache MXNet 是一个快速且可扩展的训练和推理框架,提供简洁易用的适用于机器学习的 API。MXNet 包含 Gluon 接口,支持所有技能水平的开发人员在云端、边缘设备和移动应用程序上开始深度学习。只需几行 Gluon 代码,就可以构建线性回归、卷积网络和循环 LSTM,用于物体检测、语音识别、推荐和个性化服务等场景。您可以通过 Amazon SageMaker AI(一个用于大规模构建、训练和部署机器学习模型的平台)开始使用 MXNet on AWS,获得完全托管式体验。或者,您也可以使用 AWS Deep Learning AMIs,以 MXNet 及其他框架(包括 TensorFlow、PyTorch、Chainer、Keras、Caffe、Caffe2 和 Microsoft Cognitive Toolkit 等)来构建自定义环境和工作流。
AWS Deep Learning AMIs
AWS Deep Learning AMIs 为机器学习从业者和研究人员提供的基础设施和工具可帮助他们加快任何规模的云端深度学习。您可以快速启动预装了热门深度学习框架和接口(例如 TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras)的 Amazon EC2 实例,以训练复杂的自定义人工智能模型、尝试新算法或学习新的技能和技术。无论您需要 Amazon EC2 GPU 还是 CPU 实例,Deep Learning AMI 都不收取额外收费,您只需为存储和运行应用程序所需的 AWS 资源付费。
AWS Deep Learning Containers
AWS Deep Learning Containers(AWS DL Containers)是预装了深度学习框架的 Docker 映像,可让您跳过从零开始构建和优化环境的复杂过程,助您轻松快速地部署自定义机器学习(ML)环境。AWSDL Containers 支持 TensorFlow、Pytorch 和 Apache MXNet。您可以在 Amazon SageMaker AI、Amazon Elastic Kubernetes Service(Amazon EKS)、Amazon EC2 上的自行管理 Kubernetes、Amazon Elastic Container Service(Amazon ECS)中部署 AWS DL Containers。这些容器可通过 Amazon Elastic Container Registry(Amazon ECR)和 AWS Marketplace 免费获得,您只需为所使用的资源付费。
使用 Amazon SageMaker AI 进行地理空间机器学习
借助 Amazon SageMaker AI 地理空间功能,数据科学家和机器学习工程师可以使用地理空间数据更快地构建、训练和部署任意规模的机器学习模型。您可以访问随时可用的地理空间数据源,通过专门构建的操作高效转换或丰富大规模的地理空间数据集,并通过选择预训练的机器学习模型来加快模型构建。您还可以使用带有内置可视化工具的 3D 加速图形,来分析地理空间数据并在交互式地图上浏览模型预测。SageMaker Runtime 地理空间功能可用于广泛的使用案例,例如最大化农作物产量与保障粮食安全、评测风险与保险理赔、支持可持续城市发展,以及预测零售网点利用率。
Hugging Face on AWS
借助 Hugging Face on Amazon SageMaker AI,您可以部署和微调来自 Hugging Face [开源自然语言处理(NLP)模型提供商,其知名模型系列为 Transformers] 的预训练模型,从而将设置和使用这些 NLP 模型所需的时间从几周缩短到几分钟。NLP 是指帮助计算机理解人类语言的机器学习算法。它们有助于翻译、智能搜索、文本分析等。但是,NLP 模型可能既庞大又复杂(有时包含数亿个模型参数),训练和优化它们需要时间、资源和技能。AWS 与 Hugging Face 合作打造了 Hugging Face AWS Deep Learning Containers(DLC),为数据科学家和机器学习开发人员提供了完全托管式体验,从而在 Amazon SageMaker AI 上构建、训练和部署先进的 NLP 模型。
PyTorch on AWS
PyTorch 是一个开源深度学习框架,简化了机器学习模型开发以及将其部署到生产环境的过程。通过使用 AWS 与 Facebook 合作构建和维护的 PyTorch 模型服务库 TorchServe,PyTorch 开发人员可以快速轻松地将模型部署到生产环境中。PyTorch 还为分布式训练提供了动态计算图和库,这些图和库经过调整,可在 AWS 上实现更高的性能。您可以通过 Amazon SageMaker 开始使用 PyTorch on AWS,这是一项完全托管式机器学习服务,可以轻松且经济高效地大规模构建、训练和部署 PyTorch 模型。如果您更喜欢自己管理基础设施,则可以使用 AWS Deep Learning AMIs 或 AWS Deep Learning Containers,它们基于源代码构建,并针对最新版本的 PyTorch 进行了性能优化,可帮助您快速部署自定义机器学习环境。
TensorFlow on AWS
TensorFlow 是可供研究人员和开发人员使用的众多深度学习框架之一,可通过机器学习增强其应用。AWS 能够为 TensorFlow 提供广泛支持,使客户能够在计算机视觉、自然语言处理、语音翻译等领域开发和提供自己的模型。您可以通过 Amazon SageMaker AI 开始使用 TensorFlow on AWS,这是一项完全托管式机器学习服务,可以轻松且经济高效地大规模构建、训练和部署 TensorFlow 模型。如果您更喜欢自己管理基础设施,则可以使用 AWS Deep Learning AMIs 或 AWS Deep Learning Containers,它们基于源代码构建,并针对最新版本的 TensorFlow 进行了性能优化,可帮助您快速部署自定义机器学习环境。
Amazon Textract 是一项用于自动从扫描文档中提取文本和数据的服务。Amazon Textract 的功能远不止简单的光学字符识别(OCR),还可以识别表单中的字段内容以及存储在表中的信息。
如今,许多公司手动从扫描文档(例如 PDF、图像、表格和表单)中提取数据,或者通过需要手动配置(通常必须在表单更改时更新)的简单 OCR 软件提取数据。为了取代这些开销高昂的手动流程,Amazon Textract 使用机器学习来读取和处理任何类型的文档,无需手动操作即可准确提取文本、笔迹、表格和其他数据。Amazon Textract 让您能够灵活地指定需要使用查询从文档中提取的数据。您可以以自然语言问题的形式指定所需的信息(例如“客户名称是什么”)。您无需知道文档中的数据结构(表格、表单、隐含字段、嵌套数据),也不必担心文档版本和格式之间的差异。Amazon Textract Queries 已预先针对各种文件进行了训练,包括工资单、银行对账单、W-2、贷款申请表、抵押贷款票据、索赔文件和保险卡。
借助 Amazon Textract,无论是自动处理贷款还是从发票和收据中提取信息,您都可以快速自动处理文件并根据提取的信息采取行动。Amazon Textract 可在几分钟内提取数据,无需几小时甚至几天。此外,您可以使用 Amazon Augmented AI 添加人工审核环节,以监督您的模型并核验敏感数据。
Amazon Transcribe
Amazon Transcribe 是一项自动语音识别(ASR)服务,可让客户轻松将语音自动转换为文本。该服务可以转录以 WAV 和 MP3 等常见格式存储的音频文件,每个单词都有时间戳,这样您就可以通过搜索文本轻松找到原始来源中的音频。您还可以向 Amazon Transcribe 发送实时音频流,并接收实时转录文本流。Amazon Transcribe 专为处理各种语音和声学特性而设计,包括音量、音高和语速的变化。音频信号的质量和内容(包括但不限于背景噪音、说话人重叠、带口音的语音、单个音频文件内的语言切换等因素)可能会影响服务输出的准确性。客户可以选择将 Amazon Transcribe 用于各种业务应用程序,包括转录基于语音的客户服务电话、为音频/视频内容生成字幕以及对音频/视频内容进行(基于文本)的内容分析。
基于 Amazon Transcribe 派生了两项非常重要的服务:Amazon Transcribe Medical 和 Amazon Transcribe 通话分析功能。
Amazon Transcribe Medical 使用高级机器学习模型将医学语音准确地转录为文本。Amazon Transcribe Medical 可以生成可用于支持各种使用案例的文本记录,从临床文档工作流和药物安全监测(药物警戒)到医疗保健和生命科学领域的远程医疗甚至联络中心分析的字幕。
Amazon Transcribe 通话分析功能是一款人工智能驱动型 API,可提供丰富的通话记录和切实可行的对话洞察,您可以将其添加到呼叫应用程序中,以改善客户体验和座席的工作效率。它结合了强大的语音转文本和自定义自然语言处理(NLP)模型,这些模型经过专门训练,可以理解客户服务和外拨销售电话。该 API 作为 AWS 联络中心智能(CCI)解决方案的一部分,与联络中心无关,可让客户和 ISV 轻松在其应用程序中添加通话分析功能。
Amazon Transcribe 最简单的入门方法是,使用控制台提交转录音频文件的作业。您也可以直接从 AWS Command Line Interface 调用该服务,或者使用您选择的其中一个受支持的 SDK 与您的应用程序集成。
Amazon Translate
Amazon Translate 是一种神经网络机器翻译服务,可提供快速、高质量和价格实惠的语言翻译。神经机器翻译是一种自动化语言翻译技术,它借助深度学习模型,相比传统的统计翻译算法与基于规则的翻译算法,能够提供更准确、更自然流畅的译文。Amazon Translate 支持您为不同的用户本地化网站和应用程序等内容,轻松翻译大量文本以供分析,并有效地实现用户之间的跨语言交流。
AWS DeepComposer
AWS DeepComposer 是世界上第一款机器学习驱动型音乐键盘,支持所有技能水平的开发人员在创作原创音乐输出的同时学习生成式人工智能。DeepComposer 由连接到开发人员计算机的 USB 键盘和可通过 AWS 管理控制台访问的 DeepComposer 服务组成。DeepComposer 包括教程、示例代码和训练数据,可用于开始构建生成式模型。
AWS DeepRacer
AWS DeepRacer 是一款 1/18 比例的赛车,为用户提供了一种有趣且生动的方式来开始进行强化学习(RL)。RL 是一种先进的机器学习技术,它采用的模型训练方法与其他机器学习方法截然不同。它的超强之处在于,它无需任何带标签的训练数据即可学习非常复杂的行为,并且可以在针对长期目标进行优化的同时做出短期决策。
借助 AWS DeepRacer,如今您可以通过自动驾驶实践 RL、开展实验并积累经验。您可以先通过云端 3D 赛车模拟器中的虚拟赛车与赛道入门;若想获得真实场景体验,还能将训练好的模型部署至 AWS DeepRacer,与好友同台竞技,或参与全球 AWS DeepRacer 联赛。开发者们,赛道已就绪,即刻开赛!
AWS HealthLake
AWS HealthLake 是一项符合 HIPAA 资格的服务,医疗保健提供商、健康保险公司和制药公司可以使用它来存储、转换、查询和分析大规模健康数据。
健康数据往往不完整且不一致,而且通常是非结构化的,信息包含在临床记录、实验室报告、保险索赔、医疗图像、录制的对话和时间序列数据(例如,心脏心电图或脑电图轨迹)中。
医疗保健提供商可以使用 HealthLake 在 AWS 架构 中存储、转换、查询和分析数据。使用 HealthLake 集成的医学自然语言处理(NLP)功能,您可以分析来自不同来源的非结构化临床文本。HealthLake 使用自然语言处理模型转换非结构化数据,并提供强大的查询和搜索功能。您可以使用 HealthLake 以安全、合规和可审计的方式对患者信息进行整理、建立索引和执行结构化处理。
AWS HealthScribe
AWSHealthScribe 是一项符合 HIPAA 资格的服务,让医疗保健软件供应商能够通过分析患者与临床医生的对话来自动生成临床记录。 AWSHealthScribe 将语音识别与生成式人工智能相结合,通过转录对话和快速生成临床记录来减轻临床文书工作负担。它会对医患对话进行分段处理,以识别患者与临床医生的发言角色、提取医疗术语,并生成初步临床病历。为了保护敏感的患者数据,内置了安全性和隐私性机制,以确保输入音频和输出文本不会保留在 AWS HealthScribe 中。
AWS Panorama
AWS Panorama 是一系列机器学习设备和软件开发工具包(SDK),可将计算机视觉(CV)引入本地互联网协议(IP)摄像机。借助 AWS Panorama,您可以自动执行传统上需要人工核查的任务,以提高对潜在问题的可见性。
计算机视觉可以自动执行目视检查任务,例如跟踪资产以优化供应链运营,监控行车道以优化交通管理,或者检测异常以评估制造质量。但是,在网络带宽有限的环境中,或者对于那些数据治理规则要求本地处理和存储视频的公司来说,云端计算机视觉方案可能难以实施甚至无法落地。AWS Panorama 是一项机器学习服务,支持组织将计算机视觉引入本地摄像头,从而高精度、低延迟地在本地进行预测。
AWS Panorama 设备是一种硬件设备,可将计算机视觉添加到现有的 IP 摄像机中,并通过单个管理界面分析多台摄像机的视频源。它可以在边缘生成以毫秒为单位的预测,这意味着您可以收到有关潜在问题的通知,例如在快速移动的生产线上检测到损坏的产品,或者车辆何时误入仓库中危险的禁区。而且,第三方制造商正在开发支持 AWS Panorama 的新款摄像头和设备,以便为您的独特使用案例提供更多的外形规格。借助 AWS Panorama,您可以使用 AWS 机器学习模型来构建自己的计算机视觉应用程序,或者与 AWS Partner Network中的合作伙伴快速合作构建 CV 应用程序。
返回 AWS 服务。