首页/新闻资讯/正文
从AlphaGo到梅卡曼德:技术天才邵天兰的创业之路与AI应用场景

 2025年03月12日  阅读 24

摘要:在用神之一手战胜李世石后的7个月,围棋爱好者从德国归来并开始创业,随后成立了相关事物。在2023年的AI热潮背景下,这是一个典型的技术“少年天才”。他毕业于清华本科,在德国慕尼黑工大深造机器人方向,还曾在德国参与过机器人创业公司。回国创业时年仅...

在用神之一手战胜李世石后的 7 个月,围棋爱好者从德国归来并开始创业,随后成立了相关事物。

在 2023 年的 AI 热潮背景下,这是一个典型的技术“少年天才”。他毕业于清华本科,在德国慕尼黑工大深造机器人方向,还曾在德国参与过机器人创业公司。回国创业时年仅 27 岁,就相当于 2023 年的“95 后”。

经过 8 年在真实场景中的磨砺,邵天兰获得了华创资本、红杉、IDG、美团、启明、英特尔等头部机构的融资。现在她说道:“我是一个从事基础工作的人,就像搬砖一样。”

梅卡曼德的 3D 高精度相机进入了上千个场景,与之配合的感知、规划算法也一同进入了这些场景。它在金库中码钱,在砖厂搬砖,能够检测汽车电池,还能给浴缸钻孔,并且可以码放 5800 元一箱的五粮液。

这些客户涵盖了十几个不同行业。

梅卡曼德应用场景的部分实例。

2020 年之后,根据睿工业数据显示,梅卡曼德在中国 3D 视觉引导机器人市场处于领先地位,是第一名,其市场占有率将近 40%。

2023 年的大语言模型让 AI 与机器人结合的“具身智能”赛道变得火热。通用机器人,尤其是人形机器人领域,诞生了一批新公司。这些新公司在成立之时,就将更通用的前沿具身技术作为目标。

邵天兰已经有数年在工业和物流场景中落地的经验,她对于这轮热潮有着不同的观察视角。

他看到机器人领域存在一些情况,即机器人的一些进展被过度地抬高了,行业中充满了 Hype(炒作),从而引发了“吹牛竞赛”。具体表现为:创业公司必须持续进行夸张的宣传,这样才能够融到资金;学界也需要不断夸大工作的效果,才能够发表论文。

不少人形机器人公司将工厂当作第一批试验场,然而邵天兰觉得,人形机器人与大量工业生产场景从本质上来说是不契合的:

用多台人形机器人一同去抬一个几百公斤的工件,这就如同坐着光速飞船去对打外星人一般。

他认为通用的并非是机器人本体自身,而是其核心组件。这些核心组件包含移动、操作、感知以及任务理解与规划等基础能力。凭借这些基础能力,能够快速组合成能适应不同场景的具有不同形态的机器人。

当被问到具身智能的终局价值分布情况时,他表示这个问题本身并不是很重要。他说:“有太多的人过于关注终局,然而更关键的是路径以及速度。”

邵天兰在创业过程中,从 0 开始的公司,尤其是那些有研发背景的年轻团队,必须专注于自身的优势。首先要找到第一个 PMF(产品 - 市场匹配),做出完成度足够高的产品,从而形成商业闭环。因为一开始就只讲宏大技术叙事,想要直接登月的创业公司,极少能够获得成功。

机器人是一个行业,这个行业的热点潮起潮落。邵天兰表示,梅卡曼德一直追求的事情很简单,那就是让机器人能够被使用起来。

从视频到实机展示、再到规模应用,每一步的 Gap 都很大

今年春晚,宇树人形机器人扭秧歌的表演火出了圈。作为从业者,你对这个表演是怎么看的?

邵天兰表示很喜欢这个节目。她认为宇树是足式机器人领域进展较为出色的公司之一。她觉得宇树敢在全国人民面前进行直播是很不容易的。

很多观众对机器人能够转手帕、扔手帕感到惊叹。然而,这些行为与具身智能的关系并不大。宇树自己发布了相关花絮,其中转手帕是依靠机器人手部定制的旋转机构来实现的,而抛接手帕则是通过线的收放来完成的。

真正值得关注的是多台机器人完成了踢腿等一系列动作,这展现了它们良好的运动控制能力和稳定性。实际上宇树自身并未刻意渲染抛手帕的技术,然而大众却会产生一些自发的过度宣传(炒作夸大)的行为。

晚点:现在机器人领域的 “hype” 有多大?

邵天兰指出,如今的情况与七八年前的自动驾驶情形颇为相似。现今,许多机器人创业公司乃至部分学界研究者,都会采用摆拍和剪辑的方式,制作出看上去极为酷炫的视频。这种行为使得大众对实际进展产生了过高的估计。

视频里有很多机器人能够进行跑酷以及自己做家务。然而,在线下展会和客户现场,机器人所展示的任务通常要简单得多。并且,其速度和成功率都不太理想。在抖音上,也能看到不少人在观看机器人展会之后感到非常失望的视频。

一些被炒得很夸张的技术路线,例如那些很火的具身模型,没有人能够复现它所宣称的效果,这几乎是行业内公开的秘密。

短镜头摆拍之后是一镜到底的长视频,接着是线下实机连续展示,然后是在客户真实场景里先小规模运行,再大规模运行,最后实现了成功的商业化,每一步之间的差距都很大。

这种炒作带来的一个不良后果是出现了“吹牛竞赛”。创业公司为了融到资,就必须不断比其他公司更夸张地进行宣传。甚至学术界为了能发论文,也得不断夸大工作效果。

晚点:你认为这两年,机器人和具身智能领域的实际进展是什么?

机器人擦窗价格_擦窗机厂家_擦窗机多少钱一台

邵天兰指出:其一在运动控制方面,强化学习与仿真训练使得四足、双足这类多关节复杂机械结构的运动性能得以提升,稳定性也得到增强,机器人能够更加顺畅地行走,甚至还可以跳跃。不过,这与在现实环境中实现长期、稳定的运行相比,还有很大的提升空间。

一是 AI 大模型的发展情况,例如视觉语言多模态大模型与机器人相融合,使得机器人能够初步理解指令并且看懂图纸,进而完成多步骤的复杂任务;二是视觉语言动作模型(VLA),它让机器人能够完成叠衣服等复杂操作,并且取得了初步的进展。

一是高精度 3D 相机性能提升,这是我们自己做的。二是机器人用的激光雷达性能提升。三是机器人用的关节电机性能提升。

四是产业链成本有所降低。例如,入门级多指手的价格已经下降到数万元,甚至还能更低。

晚点:为什么你把这叫多指手?不是 “灵巧手” 吗?

邵天兰表示:它现在还不够“灵巧”。仅在中国,就有十几家创业公司在从事多指手的研发工作。这个方向肯定会持续进步,然而在机械结构、传感器、控制算法等方面都还处于较为初级的阶段。与我们真正期望的“灵巧”相比,其进度条或许连 10%都尚未达到。

这属于一种语言污染。等到真正具备“灵巧”的特性时,再将其称作灵巧手也未尝不可。不然的话,到那时就只能称之为“超级灵巧手”或者“究极灵巧手”了。

晚点:那么通用机器人的整体 “进度条” 现在走到了哪儿?

邵天兰称:整体的成熟度与十几年前的自动驾驶相近。大家开始察觉到了曙光,然而,这并不意味着在 3 年、5 年甚至 10 年之内就能够完全达成。

完全通用的机器人几乎等同于 AGI。它具备感知环境的能力,能够思考且拥有记忆,还能自己做出决策并完成一连串任务。同时,机器人拥有机械结构、传感器等硬件实体,其实现难度要比软件层的 AGI 更大。

通用的不是机器人本体,而是核心组件

梅卡曼德已经成立 8 年,并且为很多工业、物流行业的客户提供了服务。2023 年之后成立了一批新公司,这些新公司一开始就从事通用机器人的业务。虽然它们现在还没有在规模上落地,但有投资人认为,像梅卡曼德这样更早进入具体场景的公司,未来会被这批直接做通用的公司所覆盖。你对这种想法有何看法?

邵天兰称,通用的本质首先在于能够适配多个不同的行业以及各种应用场景,这样就能极大地降低定制化的需求,甚至可以做到不需要进行定制化。

我们的产品如今既在车厂参与造车,又在银行金库里进行搬钱的工作,甚至还会给浴缸钻孔。它服务了汽车、金属加工、家电、3C、锂电、光伏、物流等众多行业的上千家公司,涵盖了搬运、装配、切割、焊接、涂胶、拧螺丝、质检等诸多工艺,并且是通过标准化产品实现的。这表明当前的产品已经具备了较好的通用性,并且还在迅速地拓展应用场景。

左上角是发动机连杆在无序地进行上料;右上角是物流场景中透明膜包裹在被抓取;左下角是轮胎在进行装配;右下角是汽车零部件在进行上料。

第二,并非意味着通用机器人最终都会是一个模样。通用的并非是机器人的本体,而是其核心能力以及组件。

这与电脑、手机以及汽车均不相同。电脑和手机是用于处理虚拟任务的,汽车则是在物理世界中进行工作,但其任务较为单一,主要是从 A 地到 B 地运输货物和人员;然而,机器人需要帮助人类完成物理世界里的各种复杂任务,所以注定会呈现出多种形态。

我认为未来的情况会是这样:天上有飞的机器人,地上有跑的机器人,水里有游的机器人,墙上有爬的机器人;有帮人们切钢板的机器人,有帮人们割草的机器人,有帮人们洗泳池的机器人,有帮人们扫地的机器人,有帮人们擦窗的机器人,还有帮人们带孩子的机器人……各种各样的机器人应有尽有。

它们的长相各不相同,然而组成它们的核心模块却是通用的。所有形态的机器人,从本质上来说,都能够被拆解成由移动、手的操作、视觉感知、复杂任务理解和规划等基础能力组合而成的形式。在产业链中,是通用核心零部件对不同形态的机器人提供支持。

晚点意味着这是一个“拼积木”的逻辑。那么,梅卡曼德主攻的“积木”到底是什么呢?

邵天兰称现在专注于打造机器人的“眼睛”以及“大脑”。“眼睛”指的是高精度 3D 相机,“大脑”则是机器人的感知、规划和决策能力。这些能力通过标准化且简单易用的软件交付给用户,并且能够适配不同的行业和场景。

梅卡曼德高精度 3D 相机能够进行点云成像。这种点云成像可以精确地识别黑色物体。这种点云成像还可以精确地识别高反光物体等。

晚点实际上的标准化程度如何?你们现在为新客户服务时需要部署多长时间?

邵天兰称,现在部署和调试我们自己的视觉感知系统,通常所需时间为数小时到数天,此时间包含了安装和测试的总时长。由于我们使用的都是标准化的传感器和软件套件,所以几乎不需要进行定制。

你如何定义“机器人大脑”?它是否就等同于你刚才所说的“感知+决策+规划”呢?

邵天兰表示,机器人大脑需具备常识和推理能力,能够听懂指令,也能够看懂图纸,并且可以自己想办法去完成任务目标。

大语言模型对给机器人添加“常识”很有帮助。例如,能让机器人知晓杯子是用于装水的,并且通常放置在桌上。如今大家正在探索的世界模型,也会使机器人具备物理世界的常识,像能够预判环境中其他运动物体的轨迹等。

擦窗机厂家_机器人擦窗价格_擦窗机多少钱一台

梅卡曼德的感知算法能配合大语言模型,让机器人听懂自然语言指令。同时,轨控算法也能配合大语言模型,使机器人完成任务。

这些能力未来会是由分开、分层的多个具身模型组合而成呢,还是会像自动驾驶那样有整合为同一个端到端模型的趋势呢?

邵天兰坦率地表示自己不知道。对于长远的技术路线,很难做出判断,他也不认为任何人在这方面的判断准确度能比抛一枚硬币更高。端到端是一种可能的技术路线,但它并非魔法。如今,一些人将“端到端”当作了咒语,好像念了这句咒语就能自然而然地解决很多问题。实际上,进展远远没有一些人所宣称的那么好,并且端到端也存在着大量不同的细分路线。

狭义人形机器人在工业场景没有任何优势

你们现在去工业、物流场景竞标时,会碰到做人形机器人和通用机器人的新公司吗?例如智元机器人的 CTO 彭志辉曾跟我们说,在工厂里,抓取、放置和转运这些“PPT”内容,是人形机器人最快能够落地的场景。

邵天兰表示暂时未曾遇到。她认为在当下工厂的绝大部分生产场景中,狭义的人形机器人不具备任何优势。

从亨利·福特时代的流水线起始,工业生产的逻辑在于进行分工的细化,并且极致地追求效率与可靠性。无论是观察当下的状况,还是审视未来的趋势,在工厂中进行抓取、放置以及转运的工作,都不适宜狭义的人形机器人。

若要在工厂中抓取或放置重物及大型工件,人形机器人的负载与臂展相较于重载机器人而言是有所不及的,甚至有时根本无法完成相关任务。你可以设想这样的情景:让多台人形机器人一同去抬起一个几百公斤的工件,这会呈现出一个极为滑稽的画面,就如同乘坐着光速飞船去与外星人进行搏斗一般。

梅卡曼德产品与机械臂协作,在汽车工厂的上料车内门板。此场景适宜高载重大型机械臂。

如果工件较小,人形机器人与轻型机器臂(一种特化的机械臂)等相比,在精度和速度方面都差很多。

在转运场景中,AMR 是一种更好的形态。它基于轮式移动底盘,还可以加装机器臂。这种形态更加高效,也更加稳定和安全,并且续航时间更长。

我曾去过上百家工厂。关于人形机器人在工厂中的使用方式,大家尚未得出一个良好的答案。然而,许多客户都期望拥有具备更出色智力和视觉能力的机器人。

如果客户本身就是投资方呢?比亚迪在投资人形机器人公司,上汽在投资人形机器人公司,宁德时代也在投资人形机器人公司。

邵天兰认为,demo 阶段肯定会有很大的帮助。这类支持对于机器人行业来说也是利好的。

当涉及到真实、持续的大规模应用时,他们的角色就从投资方转变为客户甲方了。工业和物流等生产场景中的客户最为看重的方面包括效率、稳定性以及部署成本。他们反而不会特别在意机器人所采用的具体技术,也不会过于在意机器人是否具有通用性。

从我们机器人公司的视角来看,通用性对方案成本和部署效率会产生极大的影响,而这正是机器人公司的核心竞争力之一。

从更长期的角度来看,人形机器人是否会由于技术的发展以及统一形态所带来的规模降本效应,从而取代现在在很多生产场景中正在运行的方案呢?

邵天兰表示,这并非单纯的技术成熟度方面的问题。此前也曾提及,狭义人形机器人在某些场景中,像搬重物以及在平地上快速移动等情况,并非是最优的形态。

真正合适人形机器人的场景具备以下特点:任务具有高度灵活性,工作环境是为人类专门打造的,并且需要机器人与真人进行交互、建立信任甚至产生共情。具体来说,像酒店、咖啡馆、餐厅等服务业,以及家务、助老等领域就符合这些特点。然而,在大量其他场景中,例如一些面向消费者(to C)、面向家庭的场景,比如扫地、擦泳池、割草等,人形机器人的效率并非是最高的。

所以刚才所说的更重要的是通用的组件,包括移动能力、操作能力、感知和决策能力。这些组件能够快速且灵活地组合出适合特定场景和任务的机器人,同时兼顾成本和效率。

资本会是一个多大的变量呢?现在有不少公司正凭借更通用的愿景来吸引大量融资。存在这样一种可能吗?那就是利用资本优势去研发更前沿的技术,并且从长期来看,能够在落地方面反超那些更早进行商业落地的公司。

邵天兰:资本是助推器,而不是物理定律扭曲器。

历史上,一开始就讲述宏大技术故事,想要直接实现“登月”这样目标的创业公司,成功的极少。例如在上一代计算机视觉的热潮里,有很多公司渴望打造大而全的 AI 平台,这些公司往往在发展过程中遭遇很大困难。

更可行的创业路径为:首先在产业链的局部环节达成足够的效率与可靠性,进而形成商业闭环和数据飞轮。即便像马斯克这样宏大叙事的代表人物,也有着极为务实的技术和产品路线。例如,马斯克的长期愿景是将 100 万人送往火星,然而他却是一步一步地进行了低成本的重复发射以及星链卫星网络的建设。

晚点:一步到位做通用机器人,这不就是马斯克带起来的风潮吗?

邵天兰称,当马斯克开始行动之时,特斯拉已然成为市值达 7000 亿美元的巨头。它不仅拥有领先的自动驾驶技术,还具备自己的工厂场景。正因如此,特斯拉具备足够的资源和耐心去进行十年、二十年甚至三十年的规划。

哪怕是那种像独角兽一样的创业公司,其资金和时间都少得很。并且一个创业公司倘若长时间没有真实业务去给予反馈和检验,就如同一个只进行训练而不参加比赛的足球队那般,是很容易偏离正轨的。

版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;

原文链接:http://wen.bjhwtx.com/post/9540.html

标签:

博览广文网

博览广文网为所有文学爱好者、新闻爱好者、关注生活多方面内容的观众朋友提供多方位的内容呈现、提升阅读空间、填充碎片时间,开阔读者的视野、增长见识、了解民生、一个让您不出户尽知天下事的网站平台!
热门标签
关于我们
广文舒阅网—让天下读者有家可归!这里汇聚了各类优质文化信息,无论是全球热点、历史故事,还是实用百科、趣味探索,您都能轻松获取。我们希望用阅读点亮您的世界,让每一次浏览都充满收获和乐趣。
导航栏A标题
广文舒阅网
扫码关注
联系方式
全国服务热线:0755-88186625
Q Q:8705332
Email:admin@lanyu.com
地址:深圳市福田区海雅缤纷国际大厦5层501
Copyright 深圳市蓝宇科技有限公司 版权所有 备案号:京ICP备20013102号-1