0755-23116643

永乐高ylg888888官方网站-人工智能的下一步是什么:英伟达、苹果、谷歌和斯坦福大学的研究人员设想了下一次飞跃

发布时间: 2025-11-11

人工智能的下一步是什么:英伟达、苹果、谷歌和斯坦福大学的研究人员设想了下一次飞跃 作者: 时间:2025-10-20 来源: 加入技术交流群 扫码加入和技术大咖面对面交流海量资料库查询

在OpenAI于2022年发布ChatGPT并进入公众意识之前,人工智能正在研究实验室中悄然发展,并在科学会议上进行讨论。由于企业界的大部分注意力目前都集中在人工智能代理和对重塑企业生产的巨大期望上,一群工程师和科学家一直在研究下一步。

湾区机器学习研讨会(BayLearn)的演讲者提供了对即将发生的事情的暗示,BayLearn是来自整个硅谷的高级科学家和工程师的年度聚会。今年的活动由圣克拉拉大学工程学院于周四主办,让我们得以一睹随着公司和研究实验室完善人工智能方法,人工智能领域的一些领先声音如何设想该技术的未来影响。

“我们不仅仅是在构建系统,我们还在尝试思考系统试图解决的根本问题,”英伟达公司应用深度学习研究副总裁布莱恩·卡坦扎罗(如图)在会议上的演讲中说。

Nvidia 的 Nemotron 推动加速计算

英伟达解决系统问题的方法的一个重要部分涉及Nemotron,这家芯片制造商的开源人工智能技术集合,旨在使人工智能开发在每个阶段都更加高效。其中包括多模态模型和数据集、训练前和训练后工具、精确算法和用于在 GPU 集群上扩展 AI 的软件。

Nemotron 是“神经模块”和变形金刚玩具系列中角色威震天的合成词,是 Nvidia 加速计算愿景的核心。

“Nemotron 是 Nvidia 如何思考未来加速计算的一个真正基本部分,”Catanzaro 说。“加速计算实际上是关于专业化......以及做一些你用标准计算机做不到的事情。加速计算不仅仅是一个芯片。

英伟达还认为,人工智能的未来进步将受到开源社区贡献的推动。Catanzaro 在演讲结束后接受 SiliconANGLE 采访时指出,Meta Platforms Inc. 以及中国的阿里巴巴集团控股有限公司和 DeepSeek 都参与了 Nemotron。

“有很多伟大的贡献,”卡坦扎罗说。“Nemotron 数据集正在被每个人使用。”

卡坦扎罗为人工智能的进步做出了自己独特的贡献。正如斯蒂芬·威特 (Stephen Witt) 关于英伟达崛起的书《思考机器》中所记录的那样,创始人兼首席执行官黄仁勋将公司转向人工智能的决定可以追溯到他与卡坦扎罗的互动,卡坦扎罗认为深度学习是人工智能未来的关键。

在与 SiliconANGLE 的对话中,Catanzaro 描述了他在现场可编程门阵列或 FPGA 方面的工作如何让他对 Nvidia 基于 GPU 的CUDA计算架构的速度产生了赞赏。他对这项技术如何应用于人工智能很感兴趣,并于 2013 年与黄仁勋讨论了该技术在机器学习中的应用。

“我看了它,认为 Nvidia 为 CUDA 带来的编程有一些特别之处,”Catanzaro 说。“当时,CUDA 并没有那么专注于机器学习。它专注于高性能计算。那段旅程非常令人兴奋......剩下的就是历史了。

启用交互式 AI

人工智能的发展和崛起历史也得益于克里斯托弗·曼宁教授等计算机科学家的影响。作为自然语言处理或 NLP 领域的著名专家,曼宁提醒 BayLearn 与会者,20 多年前,大型语言模型甚至没有受到许多科学家的关注,当时在计算语言学协会会议上发表了 33 篇关于人工智能的论文。

斯坦福大学教授克里斯托弗·曼宁 (Christopher Manning) 在 BayLearn 会议上谈到了他的 NLP 研究和人工智能。

“1993 年有多少篇法学硕士论文?”曼宁问道。“没有。如果没有 20/20 的事后诸葛亮,没有人谈论语言模型真的很令人惊讶。我们显然本可以而且应该更早地推动法学硕士。人们不相信法学硕士会有用。

然而,事实证明有用的是基于人工智能的应用程序的自然语言功能。曼宁在斯坦福大学的研究为深度学习在自然语言处理中的应用铺平了道路,此后成为人工智能发展和在当今广泛应用中的基础。

曼宁是斯坦福大学以人为本的人工智能研究所的创始人兼副所长,他表示沮丧的是,目前专注于人工智能以追求立竿见影的结果,而忽视了该技术通过与周围世界的互动变得更好的潜力。

“法学硕士根本不以交互方式工作,”曼宁说。“人类可以学习的数据比我们当前的模型少几个数量级。我们的人类学习比机器学习更好。

根据曼宁的说法,解决方案是系统泛化,人工智能模型能够超越当前用数据堵塞它们的行业解决方案,进入一个代理可以通过交互学习的世界。目标是创建将已知元素组合成新颖含义的人工智能模型。曼宁表示,这将涉及构建一个系统,该系统将通过“浏览网站”来学习,通过探索变得更好。

“在合理的程度上,暴力破解 [数据] 是有效的,但这不是人类的工作方式,”曼宁指出。“我们需要获得更有效的模型,以实现系统的泛化。”

新的机器学习和机器人工具

对系统泛化的追求将需要构建新的人工智能框架,以便在计算网络上更高效地运行。Apple Inc. 正在开发这样的解决方案,并增强MLX,用于 Apple 芯片的机器学习软件。

开源机器学习框架由 Apple 为 Mac 计算机开发。MLX 发布近两年,可以将高级Python 代码转换为优化的机器代码。有报道称,苹果还在与英伟达合作,为 MLX 添加 CUDA 后端支持,作为其降低构建机器学习框架成本的努力的一部分。

“我们认为这是一个构建为硬件量身定制的机器学习软件的机会,”苹果公司的研究科学家罗南·科洛伯特 (Ronan Collobert) 在 BayLearn 聚会上说。“我们必须从系统的角度思考如何可靠地部署人工智能。”

对于普通消费者来说,工程师对机器学习框架和编码支持的热情可能不会起到任何作用。然而,人工智能的进步也在改变机器人世界,这种方式可能很快就会在我们周围的世界中变得更加明显。

谷歌有限责任公司的 DeepMind 研究部门一直致力于开发旨在使机器人更加智能的模型。上个月,该公司发布了 Gemini Robotics 1.5 和 ER 1.5 模型,它们体现了帮助机器人真正思考的推理能力。

DeepMind 的方法以前是让机器人具备执行单一任务的能力,例如折叠一张纸。现在,它们能够使用更高级的功能,例如选择适合预测天气条件的衣服。

谷歌 DeepMind 研究副总裁Ed Chi表示,人工智能正在推动通用机器人领域的进步,机器可以根据简单的自然语言提示捡起物品并将其扔掉。它迫使工程师重新思考一个宏伟的世界愿景,在这个世界中,通用人工智能 (AGI) 使机器人能够在无限范围的人类任务中理解、学习和应用知识。

“当我没有可以打扫房子的机器人时,我厌倦了所有这些关于 AGI 的讨论,”Chi 在一次会议小组会议上说。“我们现在在机器人技术方面取得的巨大进步是在通用机器人领域。这已经足够好了。

“足够好”确实可能成为人工智能领域开发者的口头禅,因为进步以光速发展,企业继续要求立竿见影的效果。人工智能正在推动社会和经济变革,其速度甚至让最有经验的从业者都感到震惊。然而,也有人相信,随着人工智能能力的不断提高,其影响将是巨大的。

“我们目前生活在一个绝对非同寻常的时代,”斯坦福大学的曼宁说。“我们正走在一条不断进步的道路上。我们将在这项技术的发展过程中陷入疯狂的旅程。

-永乐高ylg888888官方网站