路透社消息,科技巨头 Alphabet 旗下的谷歌于周三宣布推出两款全新的 AI 模型,专门为机器人应用设计。这两款模型均基于其 Gemini 2.0 模型构建,旨在满足快速增长的机器人行业的需求。
机器人行业蓬勃发展,AI 成关键驱动力
近年来,随着人工智能技术的不断进步和模型的日益完善,机器人领域取得了显著进展。行业专家指出,这些进步正在加速机器人的商业化进程,尤其是在工业领域。
谷歌此次发布新品,正值机器人初创公司 Figure AI 终止与 ChatGPT 制造商 OpenAI 的合作协议之后。据悉,Figure AI 在机器人人工智能方面取得了内部突破,这可能促使他们决定独立发展。
Gemini Robotics:具备物理行动能力的视觉语言模型
谷歌推出的第一款模型名为 Gemini Robotics,它是一种先进的视觉-语言-行动模型,能够以物理行动作为输出方式。这意味着机器人不仅能够理解指令,还能通过实际行动来执行任务。
Gemini Robotics-ER:增强机器人环境感知和推理能力
第二款模型名为 Gemini Robotics-ER,旨在赋予机器人更强的环境理解能力。该模型使开发者能够利用 Gemini 2.0 提供的推理能力,运行自己的程序。这将极大地提高机器人在复杂环境中的适应性和决策能力。
谷歌表示,这两款模型适用于各种形态的机器人,包括人形机器人,以及工厂和仓库中使用的其他类型的机器人。
降低开发成本,加速产品上市
使用谷歌和 OpenAI 等公司开发的以机器人为中心的人工智能模型,可以帮助资金紧张的初创企业降低开发成本,并加快产品上市的速度。这对于推动机器人行业的创新和发展至关重要。
谷歌透露,他们已经在其双臂机器人平台 ALOHA 2 的数据上测试了 Gemini Robotics 模型。该模型还可以针对复杂的应用场景进行定制,例如 Apptronik 的 Apollo 机器人。
谷歌积极布局人形机器人领域
Apptronik 上个月完成了一轮 3.5 亿美元的融资,由 B Capital 和 Capital Factory 领投,谷歌也参与了投资,旨在扩大人工智能人形机器人的生产规模。这表明谷歌对人形机器人领域充满信心。
值得一提的是,谷歌曾在 2013 年收购了机器人先驱 Boston Dynamics,但大约四年后,将这家以其犬型和人形机器人而闻名的公司出售给了软银集团。
(本文由 Akash Sriram 在班加罗尔和 Kenrick Cai 在旧金山报道;Krishna Chandra Eluri 编辑)