资讯中心

作者聚焦:维托里奥丹蒂,亚马逊机器学习工程师 架构博客

2026-01-27 12:35:23
10次

作者聚焦:Vittorio Denti,亚马逊机器学习工程师

关键信息

Vittorio Denti是亚马逊的机器学习工程师,拥有丰富的技术背景。他在米兰理工大学学习计算机工程,专注于数据和人工智能。自2020年起,他加入AWS,积极参与云架构和机器学习架构的设计。目前在亚马逊的赞助展示团队中工作,致力于广告领域的机器学习算法。

在这篇作者聚焦系列文章中,我们揭晓一些AWS和亚马逊最杰出的作者。接下来,让我们通过Vittorio Denti的话,了解他在工程领域的历程!

我叫Vittorio,工作于亚马逊的机器学习工程师。我的工程之旅始于在米兰理工大学攻读计算机工程的学士学位。在攻读硕士学位期间,我开始关注数据和人工智能。在硕士期间,我在斯德哥尔摩的KTH皇家工学院学习一年,专注于机器学习和深度学习。我于2020年通过技术大学毕业项目进入了Amazon Web Services (AWS),并开始从事云架构相关的工作。在AWS的时间里,我有机会熟悉软件架构、AWS云,并发展分布式系统的系统设计技能。

在AWS,我从技术层面上得到了很大的成长,学习了新的技术和分布式系统的架构模式。我还遇到了一些优秀的导师,他们经验丰富,时常与我交流、探讨想法并解释复杂的主题。在大学学习期间,我开发了一套技术技能,而现在我能通过指导的方式来提升这些技能。

我在AWS主要工作于客户的云架构,同时也涉及内部项目和博客写作。我有机会帮助客户设计机器学习架构,以支持模型训练和实时流量,并处理数据库查询优化或微服务的异步通信等挑战。这种多样化的场景为我在机器学习之外建立横向技能打下了基础,使我能够探索未知领域。

在2022年底,我从AWS转到亚马逊,现作为机器学习工程师,参与亚马逊广告的自助解决方案赞助展示。在这个新角色中,我专注于开发和生产一些用于广告的机器学习算法。我非常喜欢这个角色,因为这里有很多探索和构建的机会。同时,了解架构和工程决策的长期影响对我的职业成长极为重要。

在亚马逊的大规模工作中,面临的因素非常多,需要仔细考量每个解决方案。这为我提供了一个学习、实验和满足好奇心的绝佳机会。如你所理解的,我总是喜欢面对新的挑战,推动自己走出舒适区,并学习新领域和技术。

到目前为止,我们举行的一些公开和内部会议让我印象深刻。2021年,我有机会参加在拉斯维加斯举行的reInvent 2021AWS的年度云大会。2023年,我去马德里参加了Amazon内部的DevCon工程会议。这些经验对我探索新技术内容,构建人际网络并从同行中学习都极其有价值。

我的思考

机器学习是一个快速发展的领域:它仍然相对新颖,创新层出不穷。工程师们努力寻找在生产环境中运行机器学习的“最佳”方式,并平衡不断出现的各种权衡。机器学习工程不仅涉及软件开发,还涉及探索、监控,以及在某些情况下构建数据集和训练模型,并将其投入生产。机器学习工程所需考虑的数据集和模型这两个主体,通常在传统软件工程中并不存在,这增加了复杂度。

一些刺激性的挑战包括在不影响延迟的情况下提高模型性能、处理不平衡的数据集,以及自动检测模型或数据漂移并解决这些问题。这仅仅是机器学习工程领域中的一些引人入胜的挑战。尽管行业已经对某些问题提供了一些答案或方向,但问题在于:我们如何在规模上做到这一点,创建成熟和可靠的解决方案?在未来的几年中,我希望能回答这些问题。例如,汽车制造商拥有成熟的供应链和制造流程,而在机器学习工程领域,至今我们尚未找到这样的对标然而我们有一批优秀的工匠在规模上努力工作,虽然确保质量的流程如代码审查和测试在逐步完善,但因领域的随机性,失效率和低效性仍然可能高企。

我还热衷于机器学习科学和软件架构。我喜欢阅读研究论文、理解最新的创新,并学习作者是如何通过什么过程获得这些成果的。许多知识可以从其他领域转移到机器学习工程中,我也在积极询问学习更多关于科学和工程的知识,以便将最新的创新应用到生产中。

喜爱的博客文章和资源

在AWS上设计一个数据网格以实现实时推荐

过去,数据架构主要围绕技术而非业务领域进行设计。在2019年,Zhamak Dehghani引入了数据网格。数据网格是将领域驱动设计DDD原则应用于数据架构的一种方式:数据被组织成数据域,每个团队拥有并提供给消费者的数据即是其产品。

为在规模上使用机器学习设计数据架构需要仔细考虑。你可能拥有不同的数据源、消费者以及来自组织不同领域的数据。此外,随着组织的成长和演变,某些数据域可能会出现或消失。2022年,我发布了一篇AWS大数据博客,探讨如何设计一个基于事件流的数据网格架构,以实现机器学习场景下的实时音乐推荐。

在这篇博客中,我们设计了一个用于AWS实时音乐推荐的事件流数据网格架构。由于机器学习应用可能有多种类型的输入数据,我们提出了一个既适用于静态数据又适用于实时流数据的解决方案。

让我们架构!专栏

让我们架构!是一项编辑倡议,自2022年1月以来每两周发布一篇关于特定主题的文章。最近的主题包括事件驱动架构、微服务、数据网格和机器学习。我们会收集四到五篇不同的AWS内容,从不同视角探讨该内容的相关性。这些内容可以是AWS博客文章、白皮书、手把手研讨会或视频。我们专注于具有价值的架构内容,面向希望了解系统设计和分布式系统的软件架构师和软件工程师。

这样的举措不仅是学习和熟悉各种技术领域的方式,也是向社区贡献和分享资源的契机。该倡议已经产生了很强的影响,目前客户和许多同事都在期待即将推出的文章。我与Luca Mezzalira、Zamira Jaupaj、Federica Ciuffo和Laura Hyatt共同致力于该倡议,并得到了AWS架构博客的支持。

ios苹果加速器

亚马逊构建者图书馆

最具启发性的学习资源之一是亚马逊构建者图书馆。它的使命是与客户分享我们在亚马逊和AWS构建安全、高可用服务的经验以及成功的持久业务。

我认为这是极其有价值的,因为我们能直接学习亚马逊在规模上运营分布式系统的经验。这不仅关乎内容本身或他们如何解决特定挑战,还关乎学习他们如何规范问题及其解决方案的旅程。如果你想了解一些AWS服务的内部设计,你还能通过图书馆的资源学习到实现它们的典型模式。

作者聚焦:维托里奥丹蒂,亚马逊机器学习工程师 架构博客

作者简介

埃莉斯Elise Chahine是AWS的架构领域内容经理,负责架构博客渠道和现场生成文档。她与作者密切合作,开发简明和技术准确的出版物,以帮助客户进行架构设计。在不与AWS的优秀人才交流时,Elise享受着她在新英格兰与家人共度的宁静时光。

全国咨询热线

13594780017

轻云加速器【官网入口】|轻云加速器

联系电话:13594780017

联系人:李总

邮箱:ascorbic@icloud.com

公司地址:芜湖市闪欲峡谷14号


微信扫一扫

手机官网