优必选董事会主席兼行政总裁周剑表示,人形机器人处在发展关键期,就这2~3年的窗口期。
4月1日,优必选宣布人形机器人Walker S接入百度文心大模型。相关视频中,Walker S接到语音任务后能用手叠衣服并回答衣服搭配的问题,还可以自主进行物体分拣。不久前,Figure AI也发布了一段人形机器人视频,展示Open AI大模型应用至人形机器人的能力,一度引起热议。人形机器人与AI结合并落地应用的未来似乎越走越近。
不过,回归商业化层面,AI与人形机器人的逐渐融合,似乎还没推动人形机器人走向商业落地。据国内“人形机器人”第一股优必选近日发布的财报,去年优必选还在亏损,备受关注的人形机器人业务,目前还不足以成为公司的收入主力。
在4月1日晚的业绩回顾与展望会上,优必选管理层向第一财经记者表示,大模型与人形机器人的结合还处于研发阶段,很难保证今年或明年一定能满足落地产品量产的要求,但公司有计划未来2~3年将大模型等AI技术赋能给量产版本人形机器人。
优必选董事会主席兼行政总裁周剑则在会上谈及公司最近进展,包括人形机器人计划今年内进入新能源汽车产线实训并在年底前完成交付,于明年进行小批量交付,今年年底优必选还将推出第一代家庭端情感陪护人形机器人。“我认为人形机器人处在发展关键期,就这2~3年的窗口期。“周剑称。而提及做人形机器人要坐多久“冷板凳”,他表示“我们有决心板凳‘坐20年、30年冷’,因为这样的硬件坐‘10年冷’可能都不够。”
人形机器人收入贡献不大
据优必选2023年财报,2023年优必选营收10.56亿元,同比增长4.7%。营收微增的同时,净亏损12.65亿元,同比扩大了28.1%。优必选延续了过去3年收入增长、净亏损扩大的趋势,2023年经调整EBITDA则亏损5.15亿元,相比上一年度收窄。
各项费用中,2023年研发费用4.91亿元,同比增长14.5%,占营收比例46.5%,销售费用达5.06亿元,同比增长35.6%。毛利方面,优必选去年毛利率31.5%,比上一年减少7.9个百分点,毛利同比减少16.2%,财报解释主要是因收入结构变化,物流、教育智能机器人及解决方案收入占比分别提升、下降,前者毛利较低,后者毛利较高。
优必选以人形机器人业务闻名,但过去3年大头的业务收入仍来自教育、物流机器人及解决方案。2023年,教育智能机器人及解决方案收入3.47亿元,物流智能机器人及解决方案收入3.9亿元,包括猫砂盆在内的消费级机器人及其他硬件设备收入2.54亿元,这三项业务的收入占比共93.8%,比上一年增加3.4个百分点。
最受关注的人形机器人,收入贡献则不多。人形机器人所在的其他产业定制智能机器人及解决方案业务,2023年收入6223.8万元,同比减少24.5%,营收占比5.9%,营收占比相比上一年还减少2.3个百分点。优必选财报解释称,当年已中标或签约的部分项目未完成交付验收,财报并未披露全年人形机器人系列Walker销量情况。而据招股书,2023年上半年优必选销售出一台Walker-2,2021年至2023年上半年Walker系列销售均价598万元。
虽然营收占比不高,但优必选财报对人形机器人多有着墨,财报提到公司实现机器人通过环境与多模态语言大模型进行交互,并自主进行任务规划的框架。该技术结合了地图数据、视觉目标识别、语言识别等多种模态信息。
财报发布后,优必选还展示了一段Walker S接入文心大模型后表现的视频。该视频主要展示了Walker S与人对话、折叠衣服、回答关于衣物颜色搭配问题,且Walker S能辨别不同种类的物体并完成分类。与此前引起热议的Figure01人形机器人视频相同的是,两者都展示了与人类对话、完成抓取任务的能力,对话都比较顺畅,且都站在桌前完成任务,没有走动。不同的则是,Figure01还展示了辨别物体颜色、一边完成具体任务一边解释自己行为的能力,Figure01对话的长度也稍长。
“我们利用了百度千问大模型对任务的拆解、对自然语言的理解和顺序逻辑排列等。除了公司去年基于开源模型训练构建的基于端侧的多模态大模型外,我们认为未来人形机器人市场竞争越来越激烈的情况下,强强联合才能实现1+1>2。”优必选管理层对该合作解释称,“国外特斯拉有大模型能力,有Open AI、英伟达与Figure的结合等,可以看到合作能为人形机器人落地提供强大技术支撑。”
AI与人形机器人融合到哪一步?
厂商近期越来越愿意展示人形机器人与AI结合的能力,但目前这种能力能否足以让人形机器人变得真正“有用”,还有待观察。一名头部互联网厂商负责AI等新技术研究的负责人看完Figure01的视频后告诉记者,Figure01这种顺畅对话,可以看出来靠的还是GPT大模型的能力,与机器人本身关系不大。
Walker S的展示视频内容也比较简单。无法从视频中看出的是,大模型能否在人形机器人行走时发挥作用,在更复杂的环境中人形机器人能多大程度“理解”周围的世界。再者,视频一开始Walker手上就拿着衣服,还不能看出能否自主抓取衣服这类柔软物体。视频中与Walker对话的人提及衣服为“黑色”,还不能看出Walker自身能否辨认物体颜色。
此前记者从机器人业内人士了解到,人形机器人要实现与AI融合还有一段距离,人形机器人技术链路长,包括硬件以及“大脑”“小脑”,以往硬件、负责智能的“大脑”和负责运动的“小脑”开发是分裂的,最近3年内三者的研发有望融为一体。
优必选管理层针对AI与人形机器人的融合程度的问题,也向第一财经记者表示,大模型出现的时间较短,场景应用中由于数据缺失,应用场景缺乏足够的验证,“更多地我们认为是处于研发阶段,很难保证今年或明年,一定能满足落地产品量产的要求。因为demo和实际应用要求的差别非常大。要考虑到可靠性、稳定性、成本等一系列要素。”
不过,优必选管理层告诉记者,大模型已能帮助人形机器人完成一些任务。在基于端到端的模型里,大模型可以完成任务拆解和逻辑排列,大模型接入使机器人本体能解决模块的问题。端到端意味着,原始数据从数据传感器采集后,经过神经网络处理,便可输出人形机器人需执行动作所需要的参量,如控制行走的速度、角度、导航路线情况等。“在很多展示中,包括Figure与Open AI合作、我们与百度的合作,目前可以实现端到端。”
管理层也向记者谈及AI与人形机器人融合的后续规划,包括大模型赋能赋予具身智能被动或主动的动作,以及让人形机器人利用物理器具与物理世界交互,并让机器人在交互中自主采集数据,用强化学习等方式提高机器人执行任务的能力。这类似于人类在犯错中增强场景适应性和鲁棒性(稳定性)。优必选已在进行相应验证测试和技术开发,计划未来2~3年赋能陪伴机器人、工业机器人等量产版本。
“公司不会因为现有技术阶段的限制而减少对未来的投资。“周剑则表示,公司已在和国内多家排名前列的新能源、传统汽车公司洽谈实训、测试以及未来落地工作,希望今年年底完成第一批人形机器人在工厂的落地,通过测试并为2025年人形机器人形成批量爆发做准备。汽车制造之外,优必选也与代工3C头部厂商洽谈实训、测试,服装鞋帽等传统消费品未来可能面临劳动力短缺,公司也在对接这种传统产业。此外,今年年底优必选计划推出第一代家庭端情感陪护人形机器人,该机器人将搭载大模型,能与用户互动并形成短期、长期记忆。
人形机器人成本高企也是阻碍商业化的一大原因。Walker系列机器人均价超500万,波士顿动力人形机器人阿特拉斯每台价格更是超百万美元。优必选管理层谈及降本问题时表示,60%~70%的成本是在研发侧解决的,如通过材料使用降低整机重量,其次是国产化器件替代。近两年人形机器人引起市场重视,行业上游投入了传感器、电机、谐波减速器等研发,但时间还不是很长,性能难以完全替代国外,公司通过软件弥补硬件性能差距。此外,要降本还需要量产。
“经过我们严谨地统计,关节占整机成本约40%~50%,结构本体目前没有涉及大规模量产,硬件本体结构是首版件,还没开模,每个单机成本都很高,占30%左右,未来要是做到几百、上千台量级,就可以直接开模,成本可以降到整机的10%左右。只要规模效应上来,相应的成本可以降到完全可以替代人工(工作)的程度,就跟以前的手机、电脑一样。”管理层表示。