近日,清华大学深圳国际研究生院冯平法教授、曾龙副教授团队在具身智能工业机器人领域取得重要研究进展,相关成果以“Embodied Intelligent Industrial Robotics: Framework and Techniques”为题,发表于智能制造领域顶级期刊《Journal of Manufacturing Systems》(中科院一区,影响因子14.2)。广州富唯智能科技有限公司作为该团队的产业化合作伙伴,深度参与了相关技术的工程化落地与产业验证工作。
清华大学深圳国际研究生院冯平法教授、曾龙副教授团队系统梳理了工业机器人核心技术的长期演进历程和规律,将其归纳为三个时代:
自动化时代(1960s-1980s):主要研究机器人本体、控制器、执行器等,实现可编程的固定任务和固定动作,追求更高的效率和准确率。这是“机器替代人力”的起点。
感知化时代(1980s-2020s):主要研究力/触觉传感技术、反馈闭环控制技术、面向环境感知的机器视觉和深度学习等技术,能更智能地、柔性地完成给定任务。机器人开始“看见”和“感受”。
具身智能时代(2020s-至今):主要研究感知-决策-技能大模型、具身智能等工业智能体技术,实现工业机器人的任务级柔性,即工业机器人领域的通用人工智能。机器人开始“思考”和“自主决策”。
每一个时代的跨越,都以前一个时代的技术积累为基石。 这是技术演进的规律,也是产业升级的逻辑。

图1. 工业机器人的发展历程
核心概念:具身智能工业机器人(EIIR)的正式提出
本文首次系统性地提出了具身智能工业机器人(EIIR, Embodied Intelligent Industrial Robotics)概念。
EIIR主要研究具有“感知-决策-执行”能力的工业智能体,在工业环境中可实现高效、准确、安全地交互以实现任务级柔性。这不仅是技术术语的创新,更是对工业机器人发展方向的一次清晰定义。AI(人工智能)、EI(具身智能)、EIR(具身智能机器人)概念与EIIR之间的关系。
人工智能(AI)主要涵盖了符号主义(如知识图谱)、联结主义(如深度学习)和行为主义(如具身智能)三个学派。
其中,具身智能(EI)可以分为虚拟智能体(如游戏智能体)和物理智能体(如机器人或自驾汽车)两大类,而工业机器人是物理智能体的主要载体。四者所涵盖的范围是由大到小的包含关系——EIIR是AI在工业领域最具体、最落地的表现形式。
本文的期望有三:第一,让该领域学者能够快速了解EIIR各领域的技术发展现状;第二,吸引更多学者和机构加入该领域的研究和资源支持,加快具身智能机器人在工业场景的落地进程;第三,总结该领域的问题与挑战,以及对潜在研究方向的思考。具身智能工业机器人技术目前已经有快速发展的势头,并有成长为一个学科领域的潜力和发展趋势。

图2:具身智能工业机器人与其他学科领域的关系
课题组经过研究发现:现有具身智能机器人技术大多面向日常生活场景,直接迁移到工业场景时仍面临显著挑战。
工业场景对效率、精度、可靠性和安全性提出了更高要求。而当前多模态大模型主要基于互联网通用语料训练,缺乏对工业机理、工艺流程、质量标准和安全规范的深入理解。因此,在工业任务规划过程中,大模型容易出现“看似合理但不可执行”的问题——这在学术上被称为“幻觉”,在工业现场则是“灾难”。
这一瓶颈,限制了现有大模型直接支撑工业机器人自主规划与可靠执行的能力。
针对上述问题,团队分析认为:具身智能工业机器人若要在工业场景中高效、准确、可靠和安全地工作,至少需要具备三类知识:
| 知识类型 | 内涵 | 作用 |
|---|
| 通用知识 | 支撑自然语言理解和人机交互的基础知识 | 让机器人“听得懂人话” |
| 工作环境知识 | 描述生产线空间布局、设备位置、可操作区域和环境约束 | 让机器人“知道自己在哪” |
| 操作对象知识 | 描述产品结构、工艺流程、零部件关系、装配参数和质量要求 | 让机器人“知道要干什么” |
基于这一认识,研究团队首次系统性地提出了知识驱动的具身智能工业机器人技术框架,该框架由五大模块组成:
世界模型(“三类知识”)
系统的核心知识源,目前通过语义地图表达工作环境知识,通过知识图谱表达操作对象知识。这是机器人的“认知底座”。
高层任务规划器(“大脑”)
负责将自然语言任务分解为符合工业逻辑的子任务序列。当用户说“请组装1000个减压阀”,规划器会将其拆解为一系列可执行的具体步骤。
低层技能控制器(“小脑”)
将抽象的子任务映射为可执行的工业技能和标准化控制指令。它调用技能库中的预定义技能,并将其转换为与设备无关的标准化指令,再通过解释器动态转换为目标控制器的协议指令。
具身智能工业机器人仿真器
用于算法开发、虚拟调试、数字孪生和产线级验证。通过ROS或OPC UA等中间件实现机器人和PLC的跨平台协同仿真,在虚拟环境中验证指令的正确性。
物理系统
完成真实制造场景中的任务执行与闭环反馈。
“大脑决策+小脑控制+躯干执行”的协同联动,让机器人在复杂工厂环境中实现自主感知、智能推理与精准执行。

图3. 知识驱动的具身智能工业机器人技术框架
相关工作以**《Embodied Intelligent Industrial Robotics: Framework and Techniques》为题,发表在智能制造领域顶级期刊《Journal of Manufacturing Systems》**(中科院一区,影响因子14.2)。论文系统梳理了知识驱动EIIR技术框架各模块的关键技术进展:
世界模型构建方法
综述了语义地图、场景图、知识图谱和本体建模等技术。其中,语义地图包含几何和语义信息,借助大语言模型(LLM)和视觉语言模型(VLM)可生成高维场景语义;知识图谱以产品、工艺和资源为核心,结构化整合产品参数、制造过程和设备资源,形成可解释的工艺推理网络。
高层任务规划方法
包括基于大语言模型的任务分解、基于视觉-语言-动作模型(VLA)的端到端规划,以及面向工业约束的增强方法。通过输入特定提示、添加视觉模块或安全模块,可显著提高LLM在工业场景中的任务规划能力。
低层技能控制器技术
涵盖工业技能库、机器人控制语言、开放词汇感知、技能泛化与多设备协同执行。技能层调用库中预定义的技能,语言层将其转换为标准化指令,解释器再动态适配不同控制器的协议。
仿真平台比较
论文系统比较了现有仿真平台在工业具身智能中的适用性,分析了虚实迁移、数字孪生和产线级虚拟调试面临的关键问题。
团队认为,未来具身智能机器人要真正落地工业场景,需要重点突破四大方向:
工业基础大模型
基于语义地图和知识图谱增强的高层规划
面向工业技能的低层控制语言
能够支撑复杂产线仿真与验证的具身智能工业机器人仿真平台
课题组团队已经针对知识驱动的EIIR技术框架中的各个模块做了比较深入的研究,包括:
语义地图构建(DSM):发表于2026年IEEE Robotics and Automation Letters。DSM通过VLM衍生语义(外观、物理属性、功能属性)丰富几何地图,构建了一个全新的三维视觉定位范式。在ScanRefer数据集上,DSM-Grounding实现了59.06%的IoU@0.5准确率,超越其他方法10%。团队已成功将其部署在物理机器人上,完成复杂的导航和抓取任务。
基于知识图谱的装配任务规划模型(AssemMate):发表于2026年ICRA。
该项工作是团队2024年所提出具身智能柔性装配系统的重要延续——《Reconfigurable flexible assembly model and implementation for cross-category products》,同样发表于《Journal of Manufacturing Systems》。
未来,团队将研发基于具身智能工业机器人的柔性装配单元,解决产品个性化时代的多品种、小批量跨品类产品装配需求,为智能装配系统探索一种新范式。 这不仅是技术的演进,更是对制造业“柔性”本质的回归。
理论的价值在于实践。 该知识驱动的EIIR技术框架让具身智能技术具有更强的落地部署能力。
课题组团队始终重视技术成果的落地应用。目前,深圳团队与产业化公司广州富唯智能科技有限公司的工程师团队紧密合作,聚拢资源,专注于具身智能工业机器人的联合攻关。“成熟一个技术模块,就先工程化落地应用一个模块”——这是团队一贯的务实理念。
目前,相关技术已通过产业化公司成功落地应用于多家头部企业:
北美新能源头部T企业:复合机器人在电池模组精密搬运与上下料场景实现7x24小时无人化作业
富士康(3C电子):3D视觉引导机械臂精准完成多品种、小批量电子元件的柔性装配与检测
伯恩光学(精密加工):复合机器人在CNC车间实现自动上下料与24小时无人化作业
这些应用受到了头部企业的高度肯定和评价,创造了不错的经济效益。
产研融合破壁垒,智涌流转助千企。 未来,团队期望有越来越多的具身智能机器人相关企业能够借鉴和改善这一技术框架,共同推动中国智能制造迈向新的高度。

图4. 具身智能工业机器人的落地应用
团队负责人简介
冯平法
柏林工业大学工学博士,清华大学长聘教授,清华大学深圳国际研究生院先进制造学部主任、鹏程学者,中国金属切削刀具协会切削先进技术研究会理事。在高速切削物理仿真方法、硬脆材料旋转超声振动加工工艺、制造装备综合性能分析与优化、数控加工精度原位检测技术等方面取得一系列研究成果。完成或正在主持国家973计划、863计划、重大专项、自然科学基金、国际合作及企业合作课题20余项,出版专著1部,发表论文200多篇,发明专利20余项。
曾龙
香港科技大学博士,清华大学副教授,清华-普渡智能服务机器人技术联合研究中心主任,深圳市普渡科技有限公司技术顾问,广州富唯智能科技有限公司联合创始人兼首席科学家。重点研究具身工业机器人方法和技术,应用于具身智能装配系统和计算机辅助装配工业软件,已发表论文90多篇,专利40多项,包括国家重点研发计划2项,国自然项目2项,深圳市科技重大专项4项。
相关论文链接
Embodied intelligent industrial robotics: Framework and techniques
Chaoran Zhang, Chenhao Zhang, Zhaobo Xu, Qinghongbing Xie, Jinliang Hou, Pingfa Feng, Long Zeng*
Journal of Manufacturing Systems, 2026(中科院一区,影响因子14.2)
项目主页:https://github.com/jackyzengl/EIIR
论文链接:https://doi.org/10.1016/j.jmsy.2026.06.001
DSM: Building A Diverse Semantic Map for 3D Visual Grounding
Hongbin Xie-qing, Zijian Liang, Long Zeng*
IEEE Robotics and Automation Letters, Vol. 11, Issue 5, May 2026
论文链接:https://ieeexplore.ieee.org/document/11456672
Reconfigurable flexible assembly model and implementation for cross-category products
Zhaobo Xu, Chaoran Zhang, Song Hu, Zhaochun Han, Pingfa Feng, Long Zeng*
Journal of Manufacturing Systems, 2024(中科院一区,影响因子14.2)
论文链接:https://doi.org/10.1016/j.jmsy.2024.08.022
关于广州富唯智能科技有限公司
广州富唯智能科技有限公司成立于2022年,是清华大学深圳国际研究生院团队孵化的产业化公司,专注于基于AI大模型的具身智能工业控制与决策系统。公司以自研AI工业大模型GRID为核心,规模化交付工业智能解决方案,产品广泛应用于汽车、CNC加工、医药、3C电子、新能源等领域,复合机器人出货量位居行业前列。