AIM207 | 以三星为特色,使用 SageMaker Canvas,做出更好的无代码机器学习决策

关键字: [Amazon Web Services re:Invent 2023, Amazon SageMaker Canvas, Machine Learning Democratization, No Code Machine Learning, Sagemaker Canvas Demo, Demand Forecasting With Ml, Business Users Machine Learning]

本文字数: 2300, 阅读完需: 12 分钟

视频

导读

世界各地的组织都使用机器学习来准确预测结果并更快地做出商业决策。然而,这通常需要准备、构建、培训和部署机器学习模型。Amazon SageMaker Canvas 为业务分析师提供一个直观的点击界面来扩展访问,无需任何机器学习经验或编写一行代码即可自行生成准确的机器学习预测。在本次分享中,您将学习如何使用 Amazon SageMake 在多种数据来源中构建机器学习模型,然后通过单击生成预测。您还将学习如何在整个组织中共享模型以提高生产率。

演讲精华

以下是小编为您整理的本次演讲的精华,共2000字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

亚马逊云科技的产品经理Sham Srinivasan在re:Invent上欢迎与会者参加“无代码ML做出更好决策”的会议。据他观察,大约40%的数据科学家、30%的业务用户以及30%的其他背景各异的人员参与了此次会议。Srinivasan表示,该会议的目的是深入探讨机器学习的民主化理念,并向大家展示无代码ML如何创造价值。他还提到,他的同事Danny Smith将在会上演示亚马逊 SageMaker Canvas的端到端功能,而三星的Derek Lee将分享他们如何使用Canvas的案例。

回顾过去,Srinivasan指出,直到2010年,机器学习才从研究实验室进入企业领域,因为它们展示了解决业务问题的潜力。亚马逊云科技很早就开始提供多种ML服务,成为了行业的领导者。然而,ML的采用仍然局限于数据科学家和工程师等角色,这些角色的占比不到1%。真正的影响力将来自于将ML普及化,使其超越技术角色,影响其他99%的非技术员工。

据Srinivasan介绍,当非技术背景的业务分析师能够运用机器学习时,民主化就取得了成功。但他们需要被解锁。尽管业务分析师了解他们的数据,但他们缺乏机器学习的专业知识,而这并非一蹴而就之事。去年,Gartner的一份报告预测,到2024年,80%的技术解决方案将由非技术人员通过低代码或无代码工具来构建。关键在于实现技术团队和非技术业务团队之间的无缝协作,而不会强迫业务团队迅速学习ML技能。

这就是亚马逊 SageMaker Canvas的作用。Canvas在2021年的re:Invent上推出,提供了一个无代码的视觉界面,使用户在单个工作空间中完成数据准备、模型构建、解释和预测等端到端的ML工作流程。复杂的统计数据被简化。按需付费意味着您只需为运行Canvas时的实际使用的计算费用买单,无需支付最低费用或预付款。

沙姆注意到,Canvas团队在根据客户反馈整合功能方面一直忙碌不停。在过去的一年里,自从推出以来,他们已经添加了用于探索性数据分析、轻松登录、数据验证、模型可解释性等功能。未来还有更多的令人兴奋的发展计划。

Canvas可以应用于各种不同的场景,如银行信贷风险评分、支付欺诈检测、预测零售顾客购买意愿、避免电信客户流失、预测物流交付时间、预测制造业设备故障等。关键是,任何拥有领域数据的业务用户现在都可以使用Canvas提问、让数据为他们工作并获得基于机器学习的答案。

随后,沙姆邀请他的同事丹尼·史密斯进行现场演示,展示如何使用SageMaker Canvas构建端到端的机器学习模型。丹尼强调了使用Canvas内置帮助的重要性,这些帮助为工作流程的每个部分提供了逐步指导的教程,从数据导入到生成预测。

丹尼通过一个制造质量工程师想要分析装配线传感器数据以预测并解释最终质量测试结果的案例进行了演示。他导入了一个包含1000多行数据和特征(如6个传感器读数和x/y偏移量)以及一个表示测试通过/失败的二元目标列的样本数据集。

演示的关键阶段包括数据探索(使用可视化和统计信息)、数据准备(如处理异常值)、模型训练(包括自动降低数据范围,从1000多行降至约700行以降低成本)、模型评估(在263行的持有测试集上)、特征重要性分析(以识别关系)、批量预测(对新数据35行进行预测)以及假设预测(以了解变量的影响)。

丹尼还展示了如何将Canvas模型与SageMaker Studio的数据科学家无缝共享。他们可以检查预处理逻辑、ML模型参数、来自自动化超参数调优的其他100多个试验以及其他成果,也可以重新训练模型并将其部署到生产中。

总的来说,演示突出了Canvas如何使业务用户能够使用机器学习分析数据并做出更好的决策,同时允许与数据科学家的协作以提高准确性、可靠性和可扩展性。

德里克·李是来自三星的一位专家,他分享了他所在的业务团队在缺乏机器学习背景的情况下,是如何成功地利用SageMaker Canvas来改进内存芯片需求预测的。

德里克解释说,他的团队主要关注运用领域专业知识来预测整个内存市场的需求。他们希望能够改进自己的方法以应对日益复杂和不确定的市场环境。在看到2022年4月的关于类似Canvas的无代码ML服务的公告后,德里克的非技术团队联系了亚马逊云科技韩国团队。

通过一个多天的数据实验室项目,他们学会了如何使用Canvas和数据准备。德里克强调,可视化的界面使得导入、处理和建模数据变得非常容易。Canvas自动推荐的时序预测模型特别有用。

将仅使用历史数据的预测与包括相关解释变量在内的预测进行比较,结果显示准确性有了显著提高。预测区间提供的结果比仅仅提供点估计更令人信服。通过将Canvas输出与他们自己的领域知识相结合,德里克的团队能够做出更好的数据驱动决策。

德里克注意到他们在ML模型的可解释性和可靠性方面仍然面临挑战。但是他们可以通过在8个季度的数据、特性和模型上迭代来持续改进预测。他的团队目标是将这种分析文化推广到整个组织。

沙姆总结说,使机器学习民主化就是让没有编程技能的业务用户能够通过无代码工具来使用机器学习,通过自动化提供机器学习最佳实践,并促进少数技术团队和绝大多数非技术业务团队之间的合作。他鼓励与会者探索Canvas工作坊、课程和文档等资源,开始他们的无代码机器学习之旅。

这次会议展示了Amazon SageMaker Canvas如何使任何业务用户都能够通过机器学习解锁他们的数据价值。通过自动化的ML、可视化界面和协作功能,消除了障碍,使没有编程技能的领域专家也能够使用机器学习。随着越来越多的组织采用无代码工具如Canvas,他们将能够做出更好的数据驱动决策,加速他们的数字化转型。

下面是一些演讲现场的精彩瞬间:

演讲者在欢迎观众参加关于无代码机器学习助力更好商业决策的讲座时,强调了在场观众中有各种各样的数据科学家、业务用户以及其他专业人士。

他/她通过展示亚马逊云科技的演示Canvas,向观众们揭示了机器学习的民主化过程,从而创造了端到端的ML价值。

在演讲过程中,演讲者详细解释了机器学习民主化的关键所在——让没有编程技能的业务分析师能够轻松地通过无代码解决方案采用机器学习,同时实现了团队协作的无缝衔接。

Canvas作为一款无代码的可视化机器学习工具,能够在同一个工作空间内提供从数据采集到生成预测来解决业务问题的全过程。

在整个过程中,AI助手会分析数据并提出建议,例如采用二元分类器模型来预测通过或失败值。

演讲者还向观众们展示了如何在Amazon SageMaker Canvas中准备和验证数据。

最后,演讲者邀请观众们对Canvas提供反馈,以便对产品进行改进和提升。

总结

这段视频探讨了亚马逊的SageMaker Canvas如何协助缺乏机器学习专业知识的商业用户在数据驱动决策方面取得进展。丹尼·史密斯展示了一个案例研究,讲述了制造质量工程师如何运用Canvas分析传感器数据并对产品质量故障进行预测。主要流程包括导入和探索数据、挑选需要预测的目标列、试运行预览模型、用自动化ML训练完整的模型、评估模型准确度、了解特征的重要性、对新数据进行预测以及与数据科学家分享模型。

接下来,来自三星的德里克·李分享了他的营销团队是如何应用Canvas的。作为没有编程经验的商业用户,他们在理解诸如S3之类的云服务时曾遇到困难。但是,借助亚马逊云科技的培训和小步快跑的策略,他们成功地将时间序列数据用于建立预测模型。这提升了预测精度,并为数据分析带来了更深入的洞察力。未来的计划是将Canvas的应用范围扩展至模型的可解释性领域。

总之,演讲者们强调Canvas通过其无代码界面使得机器学习对于商业用户变得更加易用。这推动了业务与数据团队的协作,并将一种以机器学习为核心的文化传播开来。他们的目标就是让机器学习“民主化”,从而帮助人们做出更明智的决策。

演讲原文

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐