近期,人形机器人领域在全球范围内取得了多项进展。8月6日,Figure AI发布了第二代人形机器人Figure 02,通过与OpenAI合作训练的定制AI模型,和借助机器人身上的机载麦克风与扬声器,Figure 02已能与人类进行实时的语音与语音对话。8月5日消息,优必选工业版人形机器人Walker S Lite“入职”极氪5G智慧工厂,这也是国内首次全流程执行料箱搬运任务的人形机器人,优必选正加速推动人形机器人规模化应用。
人形机器人
据《人形机器人产业研究报告》预测,2024年中国人形机器人市场规模约27.6亿元,到2035年规模有望达到3000亿元。近日,中国电子学会理事长徐晓兰表示:“在企业、政府、应用方等各方主体合力作用下,我国人形机器人产业正处于‘井喷前夜’”,我国人形机器人产业前景广阔。如今,人形机器人到底应该具备哪些核心能力正在成为未来人形机器人产业发展的关键。
人形机器人发展核心是多场景泛化能力
在众多关键技术中,多场景泛化能力无疑是推动人形机器人进步的核心驱动力。人形机器人通常具备拟人化的躯干、头部、四肢以及相应的感知、驱动和控制系统。相较于传统机器人的单一功能,通常只针对特定任务进行编程,缺乏灵活性和泛化能力,人形机器人能够执行多种任务并在不同场景下进行自主学习和适应。
从应用角度来看,具备泛化能力的人形机器人可以执行多样化的任务,从家庭服务到工业生产,大大拓展了应用范围,多场景泛化能力是满足这些多样化需求的关键;在不同工作环境中,泛化能力使机器人能更好地理解和配合人类,提高协作效率;此外,一台能适应多种场景的机器人比多台专用机器人更具成本效益,对于商业化推广很重要。
多场景泛化能力首先体现在机器人对环境的感知和建模上。现实世界环境复杂多变,充满了不确定性和动态变化,而复杂环境感知需要整合视觉、深度、触觉、听觉等多种传感器数据、
快速构建周围环境的三维模型、进行语义理解,不仅感知物体的位置和形状,还要理解其功能和意义。
其次是运动规划与控制。多场景泛化能力能够实时调整运动轨迹,以应对移动的障碍物或突发情况;根据不同的地面条件进行自适应控制;以及在与环境交互时,精确控制力度,实现柔顺操作。
第三是任务理解与执行。多场景泛化能力能够进行自然语言理解,理解人类描述的复杂任务指令;进行任务分解,将复杂任务分解为一系列基本动作;进行上下文推理,根据当前环境和任务背景做出合适的决策。
最后是学习与迁移能力。多场景泛化能力能将在一个领域学到的知识迁移到新的、相似的领域,并在执行任务的过程中不断优化性能,提高学习效率。
人形机器人是AI大模型的重要应用场景
人形机器人的多场景泛化能力在很大程度上依赖于AI大模型,同时人形机器人也是AI大模型的重要应用场景。
日前,中国信息通信研究院人工智能所专家在8月初召开的“AI大模型应用场景”产学研融通创新活动——产业问题专家研讨会上表示:“大模型虽然拥有强大的推理和计算能力,但缺乏实际应用,需要与智能体等结合,才能实现真正的产业赋能和改变使用场景”。谈到最近很火的AI智能体,他说:“大模型必须和智能体或者其他的一些机器人结合,才能打通大模型落地的最后一公里”。
当前随着AI智能体的快速发展,使人形机器人有望成为AI大模型应用落地的重要场景。
据不完全统计,截至目前,Figure AI、特斯拉、优必选、银河通用机器人、傅立叶智能、科大讯飞等企业人形机器人均已接入大模型技术。
3月,Figure公司首发了第一个OpenAI大模型加持的机器人,此后,Figure宣布与宝马制造公司签署商业协议,将AI和机器人技术整合到汽车生产中。4月,优必选与百度官宣合作,其人形机器人Walker S已接入百度文心大模型。6月,银河通用发布了首代泛化具身大模型机器人银河通用G1,已具备超强泛化识别抓取及3D视觉导航能力。7月,优必选与吉利和天奇股份达成战略合作,工业版人形机器人Walker S Lite“入职”极氪工厂。
AI和机器人技术整合到汽车生产中
此外,AI大模型也在其他机器人领域广泛应用。例如,擎朗智能与微软Azure云服务合作,计划将其基础大模型能力接入到旗舰机型T10,科大讯飞的星火大模型已赋能400余家机器人企业,覆盖工业、公共服务、家庭等机器人类型。
人形机器人离不开AI大模型
AI大模型的能力正在成为提高人形机器人多场景泛化能力不可或缺的核心要素,尤其在以下几个关键方面:
自然语言理解与生成
AI大模型在自然语言处理方面具有显著的优势。它们能够理解和生成复杂的自然语言文本,处理各种语义任务,如对话、问答、翻译等。在人机交互中,特别是需要复杂指令理解和多轮对话的场景中,AI大模型的自然语言处理能力几乎是不可或缺的,它们能够显著提升机器人与人类沟通的流畅性和智能化水平。
跨领域知识整合
AI大模型经过大规模多领域数据训练,能够跨越不同领域的知识,并将这些知识整合应用到新的任务中,当机器人需要在未知环境中快速适应新任务时,AI大模型的这种跨领域整合能力可以提供关键支持,帮助机器人在多样化的任务中表现出色。
复杂决策和推理
AI大模型在推理和复杂决策方面表现出色,特别是在非结构化和多维度信息处理方面。例如,在需要理解复杂的文本或情景以做出合理决策时,AI大模型能够表现出较强的推理能力。在涉及到高度复杂的决策任务时,AI大模型可以提供其他方法难以替代的深层次语义理解和决策支持能力。
大规模数据处理和生成
AI大模型能够处理和生成大规模的数据,这在某些需要大量数据输入或生成复杂输出的任务中是独特的优势。例如,生成大量合成数据以训练机器人,或通过对话生成各种可能的场景和解决方案。
持续学习和适应能力
AI大模型通过不断更新和扩展,可以从新的数据中持续学习和适应,保持对最新信息和趋势的理解,在需要长期应用且环境变化频繁的场景中,AI大模型的持续学习能力是不可或缺的。
AI大模型作为提升人形机器人泛化能力不可或缺的核心要素,促使人形机器人具备了在多场景中实现环境感知和建模、运动规划与控制、任务理解与执行、学习迁移等更大突破的核心泛化能力。同时,作为AI大模型的重要应用场景,人形机器人也推动了AI大模型技术的实际落地与应用。
“AI大模型应用场景”产学研融通创新活动优秀案例申报
-扫码申报-
现诚邀AI大模型应用场景解决方案及数字化转型企业踊跃申报参与由中国科协企业创新服务中心主办的"产学研融通创新活动"——《AI大模型应用场景》案例集评选。
“AI大模型应用场景”产学研融通创新活动