2025深蓝智库|星海图:“一脑多形”成为可能
2025深蓝智库|星海图:“一脑多形”成为可能
2025深蓝智库|星海图:“一脑多形”成为可能成立(chénglì)于(yú)2023年9月的具身智能机器人公司(gōngsī)星海图,是一家(yījiā)非常年轻的企业。公司年轻,创始人也年轻,四个创始人都是“90后”。虽然年轻,但星海图在具身智能领域作出的成果(chéngguǒ)不容小觑,仅成立一年多,星海图已然成为市场上关注和认可度最高的具身智能公司之一。
星海图(hǎitú)坚信,具身智能(zhìnéng)的关键表现在于“一脑(yīnǎo)多形”,脑部智能化是具身智能实现的关键卡点。基于此,星海图已搭建具身基础模型和空间智能引擎范式。
星海图(hǎitú)的(de)愿景是“部署100亿台AI机器人,服务100亿全球人口(rénkǒu)”。目前,星海图已发布R1系列仿人形通用机器人,包括R1 Pro、R1、R1 Lite三款,旨在为工业(gōngyè)、服务等多个领域提供高效、智能的解决方案。
星海图(hǎitú)是一家拥有两位(liǎngwèi)世界级具身智能算法科学家、同时任教于清华大学交叉信息研究院的具身智能创业公司,拥有在具身智能领域感知、移动和操作方向(fāngxiàng)前沿的技术理解和创新能力。
星海图从成立伊始即确立了以可(kě)落地的智能体产品为切入点、逐步构建现实商业闭环与数据闭环的发展路径。目前星海图实现(shíxiàn)了从具身本体、端到(duāndào)端算法、场景落地解决方案全栈自研。
在此前的(de)世界(shìjiè)机器人大会上,星海图首次公开了(le)从硬件到软件完全自主正向研发的全尺寸轮式双臂具身本体R1,能够有效(yǒuxiào)执行全场景、全地形、全空间的任务,完成搬箱子、捡零件、开关门、按按钮等操作。
据星海图联合创始人许华哲介绍,去年(qùnián)2月,星海图决定做自己的本体,从下决定到(dào)出产品(chǎnpǐn)大概花了6—8个月。R1不同于双足人形机器人,下肢选用了轮式360度底盘。在硬化路面上(shàng),轮式可以走得更稳更快。而且目前对机器人上半身操作能力需求更大,这样的轮式便宜、落地快,是(shì)现阶段最理想的商品形态。
而在具身基础模型EFM-1阶段,星海图采用模仿学习为(wèi)核心算法架构进行丰富的双臂操作任务(rènwù),由(yóu)许华哲提出的基于3D扩散策略DP3在真实的机器人操作任务中可以仅用40次演示数据完成(wánchéng)精确的控制,并且以85%的高成功率完成任务。
在空间智能领域,星海图联合创始人赵行发布全球(quánqiú)首个机器人Real2Sim2Real引擎(yǐnqíng),可以基于一条真实数据,扩展成数千条(shùqiāntiáo)数据,从而解决具身智能面临的数据匮乏问题。
不过,人形(rénxíng)机器人目前还处于早期阶段(jiēduàn),其顶层逻辑和语言能力主要依赖于现有的大模型。
“人形机器人(jīqìrén)的(de)操作和物理交互能力主要依赖于视觉—语言—动作大模型和强化学习。 这方面的能力依赖于数据的质量和体量,而数据正是目前具身智能的一大卡点。目前机器人最擅长的还是低(dī)精度(jīngdù)的刚体操作和部分柔性物体操作”,许华哲如是说。
作为资本的宠儿,星(xīng)海图已完成了多轮融资。
今年4月,星海图接连完成A2、A3轮系列融资,总融资额超(chāo)3亿元人民币(rénmínbì);本系列融资由凯辉基金领投,联想创投、海尔资本等产业资本参投,老股东(gǔdōng)IDG资本、高瓴创投、百度风投(fēngtóu)、同歌创投等追投,其中部分老股东多轮(duōlún)满额、超额持续加注。截至A3轮,星海图于2025年展开的A轮系列累计融资总额约1亿美元。
凯辉基金创始人及董事长蔡明泼表示,“我们持续看好具身智能在全球市场的巨大应用潜力。凯辉选择星海图,不仅因为(yīnwèi)他们展现出(zhǎnxiànchū)行业领先的全栈能力(nénglì),更(gèng)因为他们在这条长期路径上的坚定、务实与执行力”。
再早以前(yǐqián),星海图于2024年完成(wánchéng)超2亿元Pre-A轮融资,由高瓴(yóugāolíng)创投、蚂蚁(mǎyǐ)集团领投,米哈游、无锡创投集团、同歌创投、FunPlus及老股东跟投。公司天使轮、天使+轮融资则吸引了IDG资本、BV百度风投(fēngtóu)、无限基金SEE FUND、金沙江创投、北京机器人产业发展投资基金等。
尽管得到了资本市场(shìchǎng)的(de)支持,人形机器人制造商们仍(réng)需跨越“死亡谷”,找到自己的核心竞争力。在许华哲看来,目前机器人行业竞争还没有到决胜点,但是在智能算法、数据、本体、商业化(shāngyèhuà)等各个方向都有相应的竞争。
“海外的公司(gōngsī)借助一定的先发优势,在智能上有(yǒu)小幅度的领先,在硬件本体和(hé)供应链上我们则有优势,整体来说我国(wǒguó)的具身智能行业与世界最前沿处于并跑的状态。未来的关键还是谁能有最好用的本体,谁能在这个(zhègè)本体上有足够优质的数据,以及通过数据找到智能发展的那条规模定律(scaling law)曲线(qūxiàn)。当那根曲线到来,具身智能会像大模型一样再度爆发”,许华哲如是说。
此外,近日,星海图发生工商变更,新增联想中小企业发展创业投资(tóuzī)基金(天津)合伙企业(有限合伙)、厦门和合美美(měiměi)产业投资合伙企业(有限合伙)为股东(gǔdōng),同时注册资本由约100.7万元(wànyuán)人民币增至约102.8万元人民币。
· 应用场景(chǎngjǐng)解析 ·
星海图的(de)R1系列,是通用型人(rén)形(rénxíng)机器人(jīqìrén)。在许华哲看来,专用机器人人形化不是(búshì)必须,人很明显不是最优的结构。未来人形机器人一定会爆发,但应该是分段式的,先进工厂、商场再到家庭(jiātíng)。近期,斯坦福大学李飞飞团队使用星海图机器人本体,推出BRBEHAVIOR Robot Suite (BRS) 机器人套件,为家庭场景中(zhōng)的机器人全身控制移动操作提供了全新解决方案。可以期待,总有一天,人形机器人会走进家庭。
目前,星海图的(de)R1系列主要适配场景为工业和服务业。R1系列通过不同配置满足工业自动化、质量检测(jiǎncè)、物流搬运等需求。
例如,R1 Pro的双臂负载能力达10kg,支持复杂操作,适用于精密装配或高危(gāowēi)环境(huánjìng)作业;R1 Lite则聚焦数据采集和(hé)巡检任务,适合工厂或仓库环境。在服务业中,R1系列(xìliè)可执行接待、导览、清洁等任务。
许华哲称,在(zài)工厂,机器人替代人的过程已经开始。特别是一些(yīxiē)高危、极端环境,虽然规模比较小,但大家都在向这个(zhègè)方向发力,预计这种大规模的替代,可能会发生在四五年内。
现阶段,星海图的R1系列机器人主要(zhǔyào)满足(mǎnzú)大型科技企业(qǐyè)、创业公司、高校、科研机构/国家实验室这四类客户群体,在算法开发、场景落地、数据采集三个层面的需求。
某世界领先科技(kējì)大厂的具身智能实验室(shíyànshì)是星海图的客户之一,预期将机器人部署到工厂(gōngchǎng)。该具身智能实验室负责人介绍,具身智能的核心(héxīn)是移动和双臂操作,当下轮式机器人就能满足需求,尤其是针对科技工厂场景的细分任务。
星海图是为数不多首选做轮式机器人的(de)公司,R1集成(jíchéng)了灵活移动的底盘和具备复杂操作能力的双臂,尤其适用于工厂中需要连贯使用移动、导航、抓取、放置、定位等多个动作的实际(shíjì)应用场景。
R1系列在另一家客户处主要(zhǔyào)被用于智能制造场景,如汽车内饰件(nèishìjiàn)生产的场景中,使用R1去做抓取、放置、抽拉、移动、夹取等原子技能(jìnéng)的数据采集。
在商业化落地进程上,星海图将持续开拓在智能制造、仓储物流、跨境电商、家用场景中的应用(yìngyòng)潜力(qiánlì)。
“想做一道松鼠鳜鱼(guìyú)”
许华哲曾多次公开表示,最想让机器人做的是(shì)一道松鼠鳜鱼。
做一道松鼠鳜鱼非常(fēicháng)难。
“鱼是活的,能动、又滑又黏,还有颗粒状的鳞片,外硬内软。处理完活鱼,还要会改刀、油炸、炒糖色、浇汁、摆盘(bǎipán)等等,如果一个机器人(jīqìrén)能做完这些,一定程度上能证明它的智慧(zhìhuì)程度非常高”,许华哲称(xǔhuázhéchēng)。
目前(mùqián)的人形(rénxíng)机器人技术,还不足以完成这样的难度,不过随着最近一年多资本、人才的不断涌入(yǒngrù),许华哲期待,也许十几二十年就能吃到机器人做的鱼。
当(dāng)前来看,想让机器人(jīqìrén)走进家庭,成为人类的生活助手,并不容易。在实验室中,移动操作机器人或许能精准抓取(zhuāqǔ)物品或完成简单指令,但当场景切换到真实家庭环境,比如需要一边开门一边搬运重物(zhòngwù)、整理不同高度的储物架,或是清洁马桶等复杂任务时,机器人面临的挑战将(jiāng)指数上升。
家庭场景需求碎片化,机器人需处理大量非标准化(biāozhǔnhuà)任务,仿真数据与真实家庭场景差异(chāyì)大,导致泛化能力不足。
此外,机器人能完成预设动作,但如何应对(yìngduì)动态干扰仍(réng)是难题。例如机器人可以完成端茶这个动作,但如果茶杯(chábēi)被意外移动,如何顺利完成端茶这个目标,仍存在技术堵点。
不久前,李飞飞发布的(de)一套名为BEHAVIOR ROBOT SUITE(BRS)的全身操作机器人系统,便是采用星海图R1机器人平台(píngtái)进行训练。这套系统,让机器人可以流畅灵活(línghuó)地(dì)完成擦马桶、倒垃圾、整理衣物、整理杂货架等日常家务活动,变(biàn)身家庭家务的全能助手。
许华哲表示,现阶段先把偏半开放的(de)场景做好。全开放场景对模型泛化性的挑战特别大,但始终在(zài)日程上。
“人形机器人几乎显而易见地有(dìyǒu)非常广阔的场景,无论是工厂、厨房还是家庭,人形机器人都可以帮助我们做很多繁杂、辛苦甚至危险的工作(gōngzuò),其(qí)潜力巨大甚至可能改变现有的社会运行模式。当大量的劳动(láodòng)由人形机器人代劳,我们将会影响新的社会篇章”,许华哲如是说。
星海图联合(liánhé)创始人许华哲:
“脑”和(hé)“形”同样重要
Q:为什么选择做具身智能?2025年以来,这一领域空前火爆,感受到(dào)有(yǒu)哪些变化?
A:我从(cóng)(cóng)博士期间开始从事具身智能(zhìnéng)研究,从基础的(de)模仿学习、强化学习算法作为起点,从仿真逐渐部署到实体机器人上,并且(bìngqiě)融入了包含触觉在内的多模态(mótài)感知。具身智能相较于此前的人工智能如计算机视觉,需要机器人与物理环境进行(jìnxíng)交互,并且在交互中进行学习。我选择做具身智能是因为我心中一个真正的智能体,需要有改变物理世界的能力。最近的火爆(huǒbào),也让我们看到了世界对具身智能的期望,整体来讲融资的节奏加快、网络(wǎngluò)讨论度升高,甚至有相当程度的破圈。同时也有大量的人才涌入(yǒngrù)到这个新兴领域,例如我接触到了自动驾驶、大模型、计算机视觉等行业的从业者,都表达出了对具身智能行业的兴趣和转向想法。
Q:数据是具身智能发展(fāzhǎn)的一大痛点,原因是什么(shénme)?想要破解这一难题,需要在哪些方面发力?
A:以大语言模型和(hé)自动(zìdòng)驾驶为例,大语言模型可以利用所有的互联网的对话,无论是书本还是骂战,只要互联网上有,模型都可以用来当作数据燃料。自动驾驶相对来说(xiāngduìláishuō)数据更难获取,但是因为(yīnwèi)汽车(qìchē)已经(yǐjīng)存在于世界很多(duō)年,所以自动驾驶公司可以通过销售汽车及客户的驾驶经验来获取一定的数据。但机器人呢?它们(tāmen)目前还没有广泛推广,也没有太多独立的应用场景,如此一来,数据的获取便十分困难。目前的主要方法有,通过遥操作来遥控(yáokòng)机器人采集真实数据、通过物理仿真来构造机器人数据以及通过算法手段利用人类的视频数据。但目前每种数据方案都需要更深入地打磨和提升。
Q:如何看待机器人的“形”和“脑”的关系(guānxì)?
A:我认为脑和形是同样重要的(de)(de)事情。形是数据的接口(jiēkǒu)和来源,没有(yǒu)一个(yígè)足够好的机器人形态(xíngtài)和品质,我们会缺乏好的基座。相应的“脑”是我们常常讨论的人工智能的部分,它的通用性意味着机器人所能完成任务的上限。星(xīng)海图从一开始就是走“整机+智能”的路线,我们打磨“形”的同时也作为供应商提供“形”,是为了具身智能有一个足够好的数据入口,和训练测试平台。我们强调“脑”,是因为下游的应用场景只有有了更好的大脑才有可能实现。

成立(chénglì)于(yú)2023年9月的具身智能机器人公司(gōngsī)星海图,是一家(yījiā)非常年轻的企业。公司年轻,创始人也年轻,四个创始人都是“90后”。虽然年轻,但星海图在具身智能领域作出的成果(chéngguǒ)不容小觑,仅成立一年多,星海图已然成为市场上关注和认可度最高的具身智能公司之一。
星海图(hǎitú)坚信,具身智能(zhìnéng)的关键表现在于“一脑(yīnǎo)多形”,脑部智能化是具身智能实现的关键卡点。基于此,星海图已搭建具身基础模型和空间智能引擎范式。
星海图(hǎitú)的(de)愿景是“部署100亿台AI机器人,服务100亿全球人口(rénkǒu)”。目前,星海图已发布R1系列仿人形通用机器人,包括R1 Pro、R1、R1 Lite三款,旨在为工业(gōngyè)、服务等多个领域提供高效、智能的解决方案。

星海图(hǎitú)是一家拥有两位(liǎngwèi)世界级具身智能算法科学家、同时任教于清华大学交叉信息研究院的具身智能创业公司,拥有在具身智能领域感知、移动和操作方向(fāngxiàng)前沿的技术理解和创新能力。
星海图从成立伊始即确立了以可(kě)落地的智能体产品为切入点、逐步构建现实商业闭环与数据闭环的发展路径。目前星海图实现(shíxiàn)了从具身本体、端到(duāndào)端算法、场景落地解决方案全栈自研。
在此前的(de)世界(shìjiè)机器人大会上,星海图首次公开了(le)从硬件到软件完全自主正向研发的全尺寸轮式双臂具身本体R1,能够有效(yǒuxiào)执行全场景、全地形、全空间的任务,完成搬箱子、捡零件、开关门、按按钮等操作。
据星海图联合创始人许华哲介绍,去年(qùnián)2月,星海图决定做自己的本体,从下决定到(dào)出产品(chǎnpǐn)大概花了6—8个月。R1不同于双足人形机器人,下肢选用了轮式360度底盘。在硬化路面上(shàng),轮式可以走得更稳更快。而且目前对机器人上半身操作能力需求更大,这样的轮式便宜、落地快,是(shì)现阶段最理想的商品形态。
而在具身基础模型EFM-1阶段,星海图采用模仿学习为(wèi)核心算法架构进行丰富的双臂操作任务(rènwù),由(yóu)许华哲提出的基于3D扩散策略DP3在真实的机器人操作任务中可以仅用40次演示数据完成(wánchéng)精确的控制,并且以85%的高成功率完成任务。
在空间智能领域,星海图联合创始人赵行发布全球(quánqiú)首个机器人Real2Sim2Real引擎(yǐnqíng),可以基于一条真实数据,扩展成数千条(shùqiāntiáo)数据,从而解决具身智能面临的数据匮乏问题。
不过,人形(rénxíng)机器人目前还处于早期阶段(jiēduàn),其顶层逻辑和语言能力主要依赖于现有的大模型。
“人形机器人(jīqìrén)的(de)操作和物理交互能力主要依赖于视觉—语言—动作大模型和强化学习。 这方面的能力依赖于数据的质量和体量,而数据正是目前具身智能的一大卡点。目前机器人最擅长的还是低(dī)精度(jīngdù)的刚体操作和部分柔性物体操作”,许华哲如是说。
作为资本的宠儿,星(xīng)海图已完成了多轮融资。
今年4月,星海图接连完成A2、A3轮系列融资,总融资额超(chāo)3亿元人民币(rénmínbì);本系列融资由凯辉基金领投,联想创投、海尔资本等产业资本参投,老股东(gǔdōng)IDG资本、高瓴创投、百度风投(fēngtóu)、同歌创投等追投,其中部分老股东多轮(duōlún)满额、超额持续加注。截至A3轮,星海图于2025年展开的A轮系列累计融资总额约1亿美元。
凯辉基金创始人及董事长蔡明泼表示,“我们持续看好具身智能在全球市场的巨大应用潜力。凯辉选择星海图,不仅因为(yīnwèi)他们展现出(zhǎnxiànchū)行业领先的全栈能力(nénglì),更(gèng)因为他们在这条长期路径上的坚定、务实与执行力”。
再早以前(yǐqián),星海图于2024年完成(wánchéng)超2亿元Pre-A轮融资,由高瓴(yóugāolíng)创投、蚂蚁(mǎyǐ)集团领投,米哈游、无锡创投集团、同歌创投、FunPlus及老股东跟投。公司天使轮、天使+轮融资则吸引了IDG资本、BV百度风投(fēngtóu)、无限基金SEE FUND、金沙江创投、北京机器人产业发展投资基金等。
尽管得到了资本市场(shìchǎng)的(de)支持,人形机器人制造商们仍(réng)需跨越“死亡谷”,找到自己的核心竞争力。在许华哲看来,目前机器人行业竞争还没有到决胜点,但是在智能算法、数据、本体、商业化(shāngyèhuà)等各个方向都有相应的竞争。
“海外的公司(gōngsī)借助一定的先发优势,在智能上有(yǒu)小幅度的领先,在硬件本体和(hé)供应链上我们则有优势,整体来说我国(wǒguó)的具身智能行业与世界最前沿处于并跑的状态。未来的关键还是谁能有最好用的本体,谁能在这个(zhègè)本体上有足够优质的数据,以及通过数据找到智能发展的那条规模定律(scaling law)曲线(qūxiàn)。当那根曲线到来,具身智能会像大模型一样再度爆发”,许华哲如是说。
此外,近日,星海图发生工商变更,新增联想中小企业发展创业投资(tóuzī)基金(天津)合伙企业(有限合伙)、厦门和合美美(měiměi)产业投资合伙企业(有限合伙)为股东(gǔdōng),同时注册资本由约100.7万元(wànyuán)人民币增至约102.8万元人民币。
· 应用场景(chǎngjǐng)解析 ·
星海图的(de)R1系列,是通用型人(rén)形(rénxíng)机器人(jīqìrén)。在许华哲看来,专用机器人人形化不是(búshì)必须,人很明显不是最优的结构。未来人形机器人一定会爆发,但应该是分段式的,先进工厂、商场再到家庭(jiātíng)。近期,斯坦福大学李飞飞团队使用星海图机器人本体,推出BRBEHAVIOR Robot Suite (BRS) 机器人套件,为家庭场景中(zhōng)的机器人全身控制移动操作提供了全新解决方案。可以期待,总有一天,人形机器人会走进家庭。
目前,星海图的(de)R1系列主要适配场景为工业和服务业。R1系列通过不同配置满足工业自动化、质量检测(jiǎncè)、物流搬运等需求。
例如,R1 Pro的双臂负载能力达10kg,支持复杂操作,适用于精密装配或高危(gāowēi)环境(huánjìng)作业;R1 Lite则聚焦数据采集和(hé)巡检任务,适合工厂或仓库环境。在服务业中,R1系列(xìliè)可执行接待、导览、清洁等任务。
许华哲称,在(zài)工厂,机器人替代人的过程已经开始。特别是一些(yīxiē)高危、极端环境,虽然规模比较小,但大家都在向这个(zhègè)方向发力,预计这种大规模的替代,可能会发生在四五年内。
现阶段,星海图的R1系列机器人主要(zhǔyào)满足(mǎnzú)大型科技企业(qǐyè)、创业公司、高校、科研机构/国家实验室这四类客户群体,在算法开发、场景落地、数据采集三个层面的需求。
某世界领先科技(kējì)大厂的具身智能实验室(shíyànshì)是星海图的客户之一,预期将机器人部署到工厂(gōngchǎng)。该具身智能实验室负责人介绍,具身智能的核心(héxīn)是移动和双臂操作,当下轮式机器人就能满足需求,尤其是针对科技工厂场景的细分任务。
星海图是为数不多首选做轮式机器人的(de)公司,R1集成(jíchéng)了灵活移动的底盘和具备复杂操作能力的双臂,尤其适用于工厂中需要连贯使用移动、导航、抓取、放置、定位等多个动作的实际(shíjì)应用场景。
R1系列在另一家客户处主要(zhǔyào)被用于智能制造场景,如汽车内饰件(nèishìjiàn)生产的场景中,使用R1去做抓取、放置、抽拉、移动、夹取等原子技能(jìnéng)的数据采集。
在商业化落地进程上,星海图将持续开拓在智能制造、仓储物流、跨境电商、家用场景中的应用(yìngyòng)潜力(qiánlì)。
“想做一道松鼠鳜鱼(guìyú)”
许华哲曾多次公开表示,最想让机器人做的是(shì)一道松鼠鳜鱼。
做一道松鼠鳜鱼非常(fēicháng)难。
“鱼是活的,能动、又滑又黏,还有颗粒状的鳞片,外硬内软。处理完活鱼,还要会改刀、油炸、炒糖色、浇汁、摆盘(bǎipán)等等,如果一个机器人(jīqìrén)能做完这些,一定程度上能证明它的智慧(zhìhuì)程度非常高”,许华哲称(xǔhuázhéchēng)。
目前(mùqián)的人形(rénxíng)机器人技术,还不足以完成这样的难度,不过随着最近一年多资本、人才的不断涌入(yǒngrù),许华哲期待,也许十几二十年就能吃到机器人做的鱼。
当(dāng)前来看,想让机器人(jīqìrén)走进家庭,成为人类的生活助手,并不容易。在实验室中,移动操作机器人或许能精准抓取(zhuāqǔ)物品或完成简单指令,但当场景切换到真实家庭环境,比如需要一边开门一边搬运重物(zhòngwù)、整理不同高度的储物架,或是清洁马桶等复杂任务时,机器人面临的挑战将(jiāng)指数上升。
家庭场景需求碎片化,机器人需处理大量非标准化(biāozhǔnhuà)任务,仿真数据与真实家庭场景差异(chāyì)大,导致泛化能力不足。
此外,机器人能完成预设动作,但如何应对(yìngduì)动态干扰仍(réng)是难题。例如机器人可以完成端茶这个动作,但如果茶杯(chábēi)被意外移动,如何顺利完成端茶这个目标,仍存在技术堵点。
不久前,李飞飞发布的(de)一套名为BEHAVIOR ROBOT SUITE(BRS)的全身操作机器人系统,便是采用星海图R1机器人平台(píngtái)进行训练。这套系统,让机器人可以流畅灵活(línghuó)地(dì)完成擦马桶、倒垃圾、整理衣物、整理杂货架等日常家务活动,变(biàn)身家庭家务的全能助手。
许华哲表示,现阶段先把偏半开放的(de)场景做好。全开放场景对模型泛化性的挑战特别大,但始终在(zài)日程上。
“人形机器人几乎显而易见地有(dìyǒu)非常广阔的场景,无论是工厂、厨房还是家庭,人形机器人都可以帮助我们做很多繁杂、辛苦甚至危险的工作(gōngzuò),其(qí)潜力巨大甚至可能改变现有的社会运行模式。当大量的劳动(láodòng)由人形机器人代劳,我们将会影响新的社会篇章”,许华哲如是说。
星海图联合(liánhé)创始人许华哲:
“脑”和(hé)“形”同样重要
Q:为什么选择做具身智能?2025年以来,这一领域空前火爆,感受到(dào)有(yǒu)哪些变化?
A:我从(cóng)(cóng)博士期间开始从事具身智能(zhìnéng)研究,从基础的(de)模仿学习、强化学习算法作为起点,从仿真逐渐部署到实体机器人上,并且(bìngqiě)融入了包含触觉在内的多模态(mótài)感知。具身智能相较于此前的人工智能如计算机视觉,需要机器人与物理环境进行(jìnxíng)交互,并且在交互中进行学习。我选择做具身智能是因为我心中一个真正的智能体,需要有改变物理世界的能力。最近的火爆(huǒbào),也让我们看到了世界对具身智能的期望,整体来讲融资的节奏加快、网络(wǎngluò)讨论度升高,甚至有相当程度的破圈。同时也有大量的人才涌入(yǒngrù)到这个新兴领域,例如我接触到了自动驾驶、大模型、计算机视觉等行业的从业者,都表达出了对具身智能行业的兴趣和转向想法。
Q:数据是具身智能发展(fāzhǎn)的一大痛点,原因是什么(shénme)?想要破解这一难题,需要在哪些方面发力?
A:以大语言模型和(hé)自动(zìdòng)驾驶为例,大语言模型可以利用所有的互联网的对话,无论是书本还是骂战,只要互联网上有,模型都可以用来当作数据燃料。自动驾驶相对来说(xiāngduìláishuō)数据更难获取,但是因为(yīnwèi)汽车(qìchē)已经(yǐjīng)存在于世界很多(duō)年,所以自动驾驶公司可以通过销售汽车及客户的驾驶经验来获取一定的数据。但机器人呢?它们(tāmen)目前还没有广泛推广,也没有太多独立的应用场景,如此一来,数据的获取便十分困难。目前的主要方法有,通过遥操作来遥控(yáokòng)机器人采集真实数据、通过物理仿真来构造机器人数据以及通过算法手段利用人类的视频数据。但目前每种数据方案都需要更深入地打磨和提升。
Q:如何看待机器人的“形”和“脑”的关系(guānxì)?
A:我认为脑和形是同样重要的(de)(de)事情。形是数据的接口(jiēkǒu)和来源,没有(yǒu)一个(yígè)足够好的机器人形态(xíngtài)和品质,我们会缺乏好的基座。相应的“脑”是我们常常讨论的人工智能的部分,它的通用性意味着机器人所能完成任务的上限。星(xīng)海图从一开始就是走“整机+智能”的路线,我们打磨“形”的同时也作为供应商提供“形”,是为了具身智能有一个足够好的数据入口,和训练测试平台。我们强调“脑”,是因为下游的应用场景只有有了更好的大脑才有可能实现。

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎