具向科技 具身智能“进化论”:从“道具”到“兄弟”

用户投稿 19 0

具身智能“进化论”:从“道具”到“兄弟”

AI的智能化水平遵循算法、数据、算力三要素扩展法则,当三要素达到一定规模后,智能化水平将实现跨越式提升,即所谓的“智能涌现”。我们就不难理解今天为什么千亿、万亿级参数算法,大规模、高质量数据集,万卡、十万卡算力集群的发展一日千里了。

具向科技 具身智能“进化论”:从“道具”到“兄弟” 具向科技 具身智能“进化论”:从“道具”到“兄弟”

具身智能,即具身化的人工智能,是AI技术从“虚拟交互”向“实体服务”的跨越载体,是硬件传感器、机械运动关节与算法、数据、算力三要素的深度融合。将人工智能融入机器人、机械装置、新能源汽车等物理实体,为“大脑”赋予了“身体”,使得它们拥有像人一样感知、学习和与环境动态交互的能力,是智能体通过身体与环境的互动产生的智能行为。

世界各国、各行业均将具身智能视为未来科技竞争的核心领域,致力于发展机器人技术,将AI融入机器人形成具身智能的重要性日益凸显。

中国在《“十四五”机器人产业发展规划》强调,要推动人工智能、5G、大数据、云计算等技术的融合,提升机器人智能化、网络化水平。明确2025年目标成为全球机器人创新中心,具身智能是重点方向。《规划》同时指出,要强化机器人系统的功能安全、网络安全和数据安全,不断提升国家的技术能力,推动行业应用。2025年,具身智能和智能机器人首次被写入政府工作报告,明确列为新一代智能终端发展重点。

01 进化目标

具向科技 具身智能“进化论”:从“道具”到“兄弟”

中国移动具身智能产业创新中心认为具身智能的进化可分为五个阶段:“道具 ”(仅实现基础特定动作)-“玩具 ”(具备一定的互动性,限于娱乐或教育启蒙)-“工具 ”(通过算法与传感器实现精准操作,缺乏自主决策)-“伙计 ”(具备自然交互能力,提供情感交互与生活服务)-“兄弟 ”(高度智能化、自主化,接近人类行为与思维模式)。

当前机器人行业正处于从“道具”向“伙计”跨越的关键期,需重点突破具身智能与通用任务规划能力,最终实现机器人与人类的能力互补与情感共鸣。

具向科技 具身智能“进化论”:从“道具”到“兄弟”

构建像人类一样“眼-脑-手-足”协同,实现四个“自主”,即自主交互、自主移动、自主作业、自主学习,是具身智能“进化”的终极目标,也是行业正在突破的核心挑战。

主流具身智能机器人技术中,机器人“身体”通过部署各类传感器感知周围环境数据,基于本体或云端算力资源进行深度学习。构建可泛化、分布式协同、端边网云联动的具身智能变得尤为重要,也已成为行业共识。

02 典型场景分析

事实上,不同类型机器人的不同场景、不同应用中,所产生的数据规模,以及对网络、算力的需求千差万别。家庭、个人领域是具身智能应用中场景最多、感知环境最复杂的领域,每类场景均具有不同的算力、网络要求。大体上可将具身智能应用场景分为三类:实时快反应类、慢思考类(AGI)以及介于两者之间的狭义人工智能类(ANI)。

本部分梳理了各类应用场景下,对网络、算力的需求量化要求。其中算力需求部分,受算法、软件架构、实现方式等因素影响,列出的是理想情况下的算力需求量级。

(一) 实时快反应类

快反应场景,与机器人运控密切相关,要求在极短的时间内做出精准反应,典型如行走与奔跑、自主避障等。通常需要传感器快速感知环境数据,本体硬件进行一定的算法处理,快速做出反应。通常时延要求在10~100ms,数据规模在1~100MB/s,算力需求在1~20TOPS。

(二) 狭义人工智能类(ANI)

该类场景,对实时性、智能化要求折中,侧重虚拟交互,典型如语音识别、情感识别、导航等。正是由于其对算力、网络的折中要求,该类场景可由硬件本体内置算力结合小模型提供智能,亦可由边缘云、中心云智能供给,带来了多种实施可能性。通常时延要求在100~500ms,数据规模在1~50MB/s,算力需求在1~50TOPS。

(三) 慢思考类(AGI)

该类场景,对数据规模、网络带宽、算力有极高的要求,但对时延不敏感。该类场景通常无法由机器人硬件本体进行算力供给,而由边缘云、中心云等进行大颗粒度算力供给,提供智能。通常时延要求在100ms~10s,数据规模在100MB/s~10GB/s,算力需求在10TOPS~1000TOPS。

结合以上分析,可以看出具身智能对网络、算力、数据的要求跨度非常大,如时延方面,从毫秒级到秒级,相差千倍。具身智能需要“身体”、“大脑”、“神经”的有机协同,未来具身智能的进化,必然朝着异构、泛化、分布式协同的方向演进。

03 进化路径

机器人正经历从“智能机械人”向“自主机器人”的范式跃迁,精密运动控制(小脑)和机械系统(本体)为核心的技术已相对成熟,而驱动智能跃升、实现自主智能的“大脑”成为亟需突破的核心能力。构建异构、泛化、分布式协同的具身智能系统是实现“大脑”自主智能的必然路径,需均衡硬件、网络、算力三要素供给代价,同时,面向消费者仍需兼顾硬件成本、能耗、续航等因素。结合中国移动自身实践,我们形成如下方案:

具向科技 具身智能“进化论”:从“道具”到“兄弟”

方案包括具身智能体、近源智能体、云端智能体以及连接各智能体的IoA(Internet of Agent)互联网四部分。

(一) 具身智能体

负责本体实时传感、控制及轻量级计算。具有强实时性(控制周期≤1ms)、低功耗特点(嵌入式芯片)。硬件载体基于嵌入式芯片,软件方面部署ROS节点、实时操作系统(RTOS)等。核心功能逻辑分层包括传感层、实时控制层、轻量计算层等。

(二) 近源智能体

负责大颗粒算力供给,智能增强,智能体弹性部署,分布式协同及任务优化。区域自治单个近源节点管理10~100台机器人,网络时延<20ms,同时可弹性扩展,支持边缘节点动态加入、退出(如K3s轻量级K8s)。核心功能逻辑分层包括数据融合层、协同决策层、模型推理应用层等。

(三) 云端智能体

重点攻关VLA(视觉、语言、运动)具身智能大模型,聚焦四个“自主”核心能力,驱动机器人由自动化迈向自主化。负责全局优化与知识沉淀,仿真迭代训练,为本体、近源算力提供智能赋能及调度,业务管理、版本升级等。

核心功能逻辑包括:

1) RaaS能力:即Robot as a Service,提供机器人即服务能力;

2) 大数据服务:全系统运行数据存储与分析;

3) 仿真训练:具身智能行为仿真训练,大规模AI模型训练与优化;

4) 全局管理调度:全局任务拆解、分配、调度,多机、多任务任务协同;

(四) IoA智能体互联网

IoA即Internet of Agent, 智能体互联网, 连接具身、近源、云端智能体,提供高可靠、自适应连接枢纽。融合Wi-Fi、全光网络、5G/5G-A、6G、卫星通信等多种通信方式,支撑各智能体之间高速稳定互联。核心功能逻辑包括:

1) R2X通信:即Robot-to-Everything,以机器人为中心的具身智能网核心技术,通过无线或蜂窝通信实现机器人与周围环境的全方位交互。其内容涵盖通信模式、应用场景、技术标准及生态系统,包含R2R(Robot to Robot),R2P(Robot to Person)、R2I(Robot to Infrastructure)、R2N(Robot to Network)等各项通信能力。

2) 分布式自组网:实现机器人自主分布式协同,降低对云端、网络依赖,具备低时延、节能、节省频谱资源优势。

3) 专网通信:网络切片能力,机器人专网,为实时指令控制、音视频码流等提供端到端差异化转发调度。

4) 通感一体:未来网络基础设施应具备通感一体能力,集成高精度定位、激光、雷达等感知能力,实现通感深度融合。如当前5G-A基站载波相位测量等技术提供高精度定位,除基础网络能力外,还可用于机器人自主避障、行走奔跑、精细操作等场景。

5) 语义通信:具身智能机器人集成了各类传感器,有大量数据传输交互,网络带宽需求激增,依靠传统原始环境数据采集并直接传输,难以适应智能化需求。语义通信是提升机器人智能化水平及环境自适应鲁棒性的关键通信能力。

04 展望

具身智能产业方兴未艾,中国移动将分阶段推出“家家可及”的机器人“兄弟”。2025年重点围绕迎宾导览、家庭陪伴两大系列打造商用级产品,推动四足狗系列成为家庭场景消费级产品;围绕居家服务前瞻布局家庭场景通用机器人产品。与此同时,基于促进产业协同发展理念,成立产业发展联盟,覆盖企业、高校、机构等不同角色,构筑“产-学-研-用-测”闭环体系;建立开放式中试基地,推动技术中试转化,打通从研到用“最后一公里”;建立能力开放体系,推动关键成果产业共享。加速形成产业从“组起来”到“干起来”到“用起来”的“飞轮效应”。

具身智能机器人的智能化、网络化是实现“类人”的核心关键,面向未来单体智能必将从自动走向自主,单体智能必将走向群体智能。

【参考资料】

[1] 3GPP V2X系列标准(Release 14~18)

[2] Brooks, R.A., 1991. Intelligence without representation. Artificial intelligence, 47(1-3), pp.139-159.

[3] Pfeifer, R. and Scheier, C., 2001. Understanding intelligence. MIT press.

[4] Smith, L.B., 2005. Cognition as a dynamic system: Principles from embodiment. Developmental Review, 25(3-4), pp.278-298.

[5] Lakoff, G., & Johnson, M. (1999). Philosophy in the Flesh: The Embodied Mind and Its Challenge to Western Thought. Basic Books.

[6]《智能体互联网 - 定义、架构与应用》,北京邮电大学,刘军、禹可、陈科良、李珂

作者:

程宝平 中国移动首席专家,中国移动智慧家庭运营中心具身智能产业创新中心总经理

晁军显 中国移动“十百千”专家,具身智能系统架构师

高金飞 具身智能平台研发技术经理

许学 具身智能本体研发技术经理

审核:

程宝平 中国移动首席专家,中国移动智慧家庭运营中心具身智能产业创新中心总经理

本文图片均系原创,转载请注明出处

具身科技完成数千万元天使轮融资

【具身科技完成数千万元天使轮融资】《科创板日报》26日讯,近日,人形机器人研发商具身科技完成数千万元天使轮融资,本轮投资方为策源资本、沛坤基金。具身科技成立于2024年9月,专注于人形机器人、四足机器人的研发、生产与销售,主要产品包括天行者1号人形机器人以及灵瞳L3型、灵瞳L3P型四足机器人,应用于工业、科教娱乐、应急救援等行业。

相关问答

人类历史上出现过哪些极具科技感的飞行器?

Ho229开创了一个新的飞行器布局方案——飞翼布局。基本上飞翼布局的飞行器都是具有满满的科技感。其次,要说到的是X系列飞行器,X系列飞行器是美国Nasa为了验...

农村信用社是国营机构还是私企?-汇财吧专业问答

[回答]公务员职位按职位的性质、特点和管理需要,划分为综合管理类、专业技术类和行政执法类等类别。国务院根据中华人民共和国公务员法,对于具职位特殊性,...

思域和明锐哪个好,新款明锐深得人心-太平洋汽车

[回答]Octavia是一款新推出的车型。升级后的外观和内饰都发生了一些变化,配置也变得更具科技感。自推出以来,受到了广大车迷的追捧。思域(查成交价|参配|...

店小二售后电话是多少?-一起装修网

[回答]新乡市店小二厨业公司是一所专业生产*剪、厨具的公司。公司创办于20世纪50年代初期,公司占地面积3.3万平方米,其中*具生产基地占地面积约1.2万平方...

有谁知道十大光缆品牌排行?-一起装修网

一起装修网问答平台为您提供有谁知道十大光缆品牌排行?的相关答案,并为您推荐了关于有谁知道十大光缆品牌排行?的相关问题,一起装修网问答平台:装修问题,因我而止...

镐京学院是几本

[回答]镐京学院是三本。镐京学院一般指陕西科技大学镐京学院,在陕西是第三批次本科招生,所以我们通常说陕西科技大学镐京学院是三本大学。扩展资料陕西科...

与时俱进要做好三个方面?

1.分析自己的才能:利与弊。也就是说客观认识自己,做出明智的决断。2.分析行业新动态、新发展。处处留心,皆机会。作为一个优秀的职业人士,就必须眼观六路,...

深圳科技大学是一本还是二本院校

[回答]二本不是一本。深圳技术大学是深圳市的一所独立公立应用型本科院校,面向高端产业发展需求,致力于培养高水平工程师、设计师等极具“工匠特色”的顶...

上海推进市区老旧小区改造更新,如何应用新科技来提升改造后...

上海在推进市区老旧小区改造更新中,积极应用新科技来提升改造后住房的品质。通过引入创新设计,结合智能家居系统,实现家居设备的远程控制和自动化管...

关于科技之光中的一句话?上次看到科技之光里讲的,不太明白...

[最佳回答]恒星形成后开始进入生命周期中的氢燃烧阶段,氢的原子核聚变成氦,并向外发放光和热。当恒星中的氢消耗掉10%时就发生收缩,恒星中心部位的温度升高到1...

抱歉,评论功能暂时关闭!