未来,我们或许需要去构建属于自己的统一计算框架。如果能够成功打造好这个框架,那么国内的 GPU 芯片生态建设就一定会向前跨出很大的一步。
采访|何伊凡文|《中国企业家》记者 赵东山
腊月二十八那一天,中科闻歌的董事长王磊与团队进行了开会。会议一直持续到凌晨 2 点。他们这些技术嗅觉较为敏感的人,一直在探讨可能给自身以及行业带来的影响。
2025 年春节前夕,AI 智能助手冲上了中美 iOS 免费应用排行榜的第一名。它凭借在技术优化方面的优势、成本压缩方面的优势以及开源模式方面的优势,迅速在全球 AI 大模型圈引发了冲击波,到现在热度依然没有降低。
真正的变革在于之后的 AI 技术能快速普及惠及大众。同时,行业以及个人应用层面的变革和创新也在加快。在未来 18 个月里,我们能够看到各行业的 AI 渗透率迅速地突破零界点。身处行业中心的王磊表达了自己的思考。
春节过后,中科闻歌旗下的智川 X-平台全面接入了全系大模型。凭借多种模型的支持,其客户能够快速构建行业 AI 应用,像 AI 搜索、翻译、客服以及报告生成等。这样一来,就降低了技术门槛,同时也缩短了开发周期。
2017 年,王磊从中国科学院自动化研究所离职,随后创立了中科闻歌。其核心创始团队中,除了联合创始人罗引博士等青年科学家外,还有海外归国的教授,这位教授是 IEEE、AAAS 的成员,同时也是中国科学院自动化研究所的研究员曾大军。曾大军早年在美国卡内基梅隆大学攻读人工智能博士学位,在这期间,他的导师是智能体()理论的主要奠基者之一。
2018 年,国家提出了融媒体建设这一举措。中科闻歌迅速将注意力集中在了 AI+媒体领域。王磊回忆道,在那一年中,他飞行了 174 次,平均每两天就有一趟行程。甚至还在大雪纷纷的夜晚,被困在了内蒙古呼和浩特到山西右玉县的高速路上。随后的 5 年时间里,中科闻歌进一步将业务的触角延伸到了金融、医疗、能源等领域。
2022 年出现,王磊毅然决定自行研发雅意大模型。到 2024 年,中科闻歌的收入达到数亿级别。其中,超过一半的营收与雅意直接相关。80%以上的收入源自雅意的强大支撑。其生态合作空间较为广阔。交付项目的周期明显缩短。复杂项目从过去需要交付的 6 至 9 个月降低到现在的 3 个月左右。
过去两年里,资本对于大模型创业公司的态度发生了快速转变,从之前对技术的信仰转变为注重务实落地。在引爆全球 AI 大模型圈之后,一切都有了改变。金沙江的创始合伙人朱啸虎,以前认为“大模型六小虎的最佳结局是被大厂收购”,而如今则认为“今年最佳的投资主题是 AI”。
在王磊看来,机会来了。
过去 7 年期间,中科闻歌进行了底层 AI 大模型与数据技术的研发工作。它推出了国产全自主知识产权的雅意大模型、优雅多模态视频模型以及决策智能操作系统 DIOS,将重点放在了决策智能和大规模机器学习模型的研发上。与此同时,它也更加专注于上层的行业应用。
2024 年 12 月,美国有一家 AI 数据分析公司获得了 100 亿美元的巨额融资。这一融资额超过了上次 60 亿美元的融资纪录,并且使其成为当年规模最大的一笔风险投资。王磊进行了分析,他指出:数据与 AI 的市场前景非常广阔。正是由于决策智能化时代的来临,才使得这类以数据为驱动、以创新 AI 基础架构为支撑、致力于大数据应用落地的企业,成为了资本市场的宠儿。
王磊沉浸在 AI 赛道多年,他对 AI 的判断更为深刻。他表示,AI 就像一场马拉松,企业级 AI 的价值已经到来,这不是短期的资本游戏,而是一场持续 20 年的智能革命,在这个过程中,坚持是最重要的。
《中国企业家》对中科闻歌董事长王磊进行了访谈,以下是访谈实录(有删减)。
的震撼和启发
《中国企业家》:在使用和研究时,受到怎样的震撼?
王磊总结为以下 4 个方面:中文理解效果方面;技术创新性方面;成本降低方面;AI 生态贡献方面。
R1 出现之前已经有很多版本,我们一直都在关注。起初主要是因为觉得效果不错,尤其是在中文能力方面表现得很突出。如果说以前的 AI 中文水平能达到信和达,那么现在则有了“雅”的感觉。
后来看到了他们的技术报告。发现他们的技术具有很大的创新性。尤其是在 R1 方面,在后训练阶段大规模使用了低数据样本的强化学习。并且采用了 MoE+RL(混合专家模型结合强化学习)这种方式。在仅有极少标注数据的情况下,极大地提升了模型的推理能力。
R1 的训练成本是原来的 1/10 到 1/20 ,成本大幅降低,这让人感到欣喜。以往大家都认为训练模型需要高成本且需要多芯片,要花费很多钱,而成本下降后,会让大家更有意愿深入参与这件事。
此外,开源技术论文等是允许的,并且可以用 R1 进行数据蒸馏来训练自家模型,这在生态方面的贡献极为巨大。原本我们一直认为中美 AI 之间存在很大距离,然而的出现让大家明白,只要勇于创新和突破,就能够与世界顶尖 AI 水平并驾齐驱。
我认为,其火爆将会对全球 AI 市场的应用落地和产业化进程产生极大的推动作用。中国市场规模庞大,AI 行业的应用企业迎来了全面的爆发态势。我们甚至有可能孕育出一批如同在互联网时代那样的 AI 平台型和应用型企业。
《中国企业家》指出,开源与闭源的争论是此次行业争论的关键问题。那么,此次的火爆能够被理解为是开源取得了胜利吗?
王磊称,开源与闭源的争论在软件时代就已存在。他虽看好开源,但也觉得在闭源领域率先取得突破是很有必要的。
开源开放生态对生态创新和技术发展有帮助。我们要充分理解闭源模型,因为它们在之前的探索中投入了诸多资源、资本以及努力。应当鼓励它们保护知识产权成果。当它们保持技术优势后,先进行部分开源,接着再逐步实现全面开源,这是一个行业螺旋式上升的过程。
《中国企业家》的训练成本引发了诸多关于工程优化创新的讨论。许多人觉得他们避开了英伟达的 CUDA 平台,进而提升了节点间的通信效率。对此,你持何种看法?
王磊称:CUDA 是英伟达公司设计研发的一种并行计算平台和编程模型,其中包含了 CUDA 指令集架构以及 GPU 内部的并行计算引擎。CUDA 在大模型训练中是重要的算力工程管理平台,能在优化使用以及提升效率等层面发挥关键作用。当几千张甚至几万张卡并行运作时,要充分利用每张卡的运行性能,提高利用率和计算并行度,让算子执行效率更高效,这一直是训练模型过程中需要考虑的问题。
这次媒体存在一个误解,即把 PTX(一种底层硬件指令集,能够直接与 GPU 驱动函数进行交互,从而实现更精细的硬件操作)与 CUDA分割开来。实际上,PTX 也是 CUDA 的组成部分,并且它更贴近硬件。CUDA 本质上是用来操作大规模 GPU 卡的一种操作系统。PTX 处于更底层,并且在它下面还有一层是机器执行语言。从论文中能够看出,靠近硬件层确实是可以进行一些技术优化的,这样能够节省时间与成本。
未来,我们或许需要去构建属于自己的统一计算框架。如果能够将其打造好,那么国内的 GPU 芯片生态建设将会向前迈进很大的一步。这当然离不开 AI 开发公司以及研发公司的共同努力,此次在这方面的工作能够激励更多的技术人员深入到底层硬件去开展相关工作。
《中国企业家》:你觉得为什么是做到了?
王磊称,目前在国内,能够在大规模算力卡上进行训练的队伍数量有限。不仅需要具备这样的训练环境,还得有优秀且合理的人才队伍,各个层次的人才都不可或缺。因为拥有良好的硬件训练环境以及齐备的人才等相关条件,所以他们的创新能够激励更多有实力的企业投身于 AI 研发。
《中国企业家》询问:目前在业内,大家认为它的创新点有哪些呢?除了能够降低成本之外,还在于不需要进行有监督的微调。你认同这样的说法吗?
王磊认同它在从 V3 到 R1 的训练过程中,主要创新亮点在于通过少量冷启动数据提供样本,借助强化学习框架,利用评价机制提升模型能力,从而达成目标,而非依赖过去大量提交标注和提示词的模板。他也有不同观点。他觉得这在强化学习提升模型能力方面确实走出了一条新路径。
在实际的产业落地方面,存在两个关键的边界。其一,当遇到医疗诊断、复杂科学问题解决这类场景时,通过用高质量训练语料进行微调,仍然是一种非常经典且可靠的实现途径。其二,尽管 R1 在文本生成和中文方面的表现较为出色,然而在专业领域的深度推理能力上,依然还有很大的提升空间。像闻歌这样的团队,拥有高价值行业数据,并且能够从底层对模型能力进行进一步优化,这样的团队将越来越不可或缺。
《中国企业家》:他们所采用的方式是 MoE+RL ,这是重要的创新之处吗?
王磊称,MoE(混合专家模型)属于经典路线。我们提出问题后,它能够自动将问题路由至局部专家模型。在训练专家模型时,可以对其分别进行训练。而在回答问题时,无需激活全局参数即可作答。这样做大大降低了算力的消耗。
存在一些其他大模型共有的不足,例如推理过程不够简洁,幻觉和安全性问题在很大程度上依然存在,基础常识和处理复杂问题的准确性不一致等,这些都需要迫切解决。
《中国企业家》询问:此次未公布预训练的语料,你在个人使用后,觉得它的预训练过程具有哪些特点?
王磊称预训练的规模很大,达到了 14.8 万亿。这表明在预训练阶段,Law(规模化法则,也称尺度定律)很有意义,语料的收集整理以及高质量语料起着关键作用。同时,他也十分期待未来在预训练阶段,仅用少量语料输入就能达成良好的模型效果。
《中国企业家》询问:最近朱啸虎的态度发生了巨大转变,他几乎都要相信 AGI 了。你认为 AGI 究竟还有多远呢?你所理解的 AGI 是怎样的呢?
诺贝尔奖获得者哈萨比斯认为,现在距离 AGI 尚需 2 至 3 个量级的成果。AI 大模型要既能理解高深复杂的问题,又能在常识性问题上表现良好,对简单和复杂问题都能达到精准理解且高质量作答保持一致。同时,这些 AI 工具必须能够大力推动行业研究、工业生产以及日常生活的进步,这是 AGI 的基础。
我认同他的观点。我认为 AI 不会取代人类。AGI 状态应该是人机共融。就如同我们公司的名字“闻歌”,闻弦歌能知雅意,高山流水,人机共融,只有当技术与人类社会发展和谐共生时,才是我期待看到的 AGI 时代。
《中国企业家》:所以观念对齐很重要。
王磊表示,全球都对这块予以重视。他身为实验室副主任,和中国科学院自动化所的研究员曾毅,在北京市科委的支持下创建了人工智能安全与超级对齐北京市重点实验室。当下,我们过多地将注意力放在 AI 的超级智能边界和能力上,而安全对齐乃是发展人工智能必须要走的道路。我们的实验室致力于在人类价值观方面实现进一步的安全对齐,同时致力于在人机和谐共处方面实现进一步的有序对齐。
给行业带来哪些机会
《中国企业家》:我们看到了智川的全面接入。那么,全面接入具体意味着什么呢?
王磊说:“智川”X 是闻歌推出的一个面向全行业的一站式智能体开发平台。这个平台内置了我们拥有自主知识产权的雅意大模型,同时也支持根据需求接入国内外先进的大模型,其中包括……
人们与它的对话仅运用了它的一小部分功能,实际上它作为 AI 基座,能够发挥出更大的作用,像可以提供定制服务、进行数据处理、开展报表分析等。一方面是人工智能基础模型,另一方面是现实中的企业和个人需求,中间的差距由谁来弥补呢?那就是我们的智川平台。这些技术模型在智川平台上,可以根据自身的业务来定制数据并且调用相关工具,最终能够实现企业级的应用。
我们认为 2025 年是 AI+的起始之年。智川需要做的事情包括,依据这些基础模型,去处理企业接入到提升企业生产力过程中的最后一公里问题,以使大模型能够惠及更多的人。
《中国企业家》:和 出现之后,你们在做哪些调整?
王磊称,AI 技术生态与产品生态规模庞大,o3 是其基础平台。然而,在支持领域开放问题或解决复杂任务方面,仍存在诸多难点需要攻克。例如,要基于大模型来打造数字人或数字员工应用,目前还有一定距离。
我们的基础模型已跻身全球主流榜单的前十位。我们更为关注用户端以及行业端的 AI 应用需求。去年,我们成功地将 40 多个行业级产品模型落地。这些产品模型帮助客户提升了生产效率。如何运用新技术服务好客户并解决真实需求,是我们一直坚守的方向。
AI是场马拉松,现在说不好谁是王者,坚持最重要。
《中国企业家》称,AI 公司存在两种情况。其一,如同冰面上的天鹅,格外引人注目;其二,宛如水面下的大鱼,虽很凶猛,但在未跃出水面之前,是难以被关注到的。身为中科闻歌的董事长,你对这两种公司选择持何种看法?
王磊称,被关注存在多个方面。其中,媒体和大众构成一个方面,而行业客户则是另一个方面。我们始终坚定不移地去做那些困难的事情,勇敢迎接最为艰难的挑战。正是因为有了这种坚持,才使我们得以成为为数不多的能够从 AI 1.0 阶段发展到 AI 2.0 阶段,进而迈入 AI 3.0 阶段的一家企业。
在经典人工智能的 AI 1.0 时期,我的老师曾大军早在 1994 年于美国卡内基梅隆大学开展了研究。他开展的是非常前沿的人工智能研究,包括提出多智能体体系以及探索机器学习框架等。他的学生们也取得了很多有影响力的成果。
在 AI 2.0 阶段,也就是面向领域的数据驱动深度学习时代。从创业伊始,我和罗引博士就十分注重专用人工智能算法的研发。因为要实现对数据的理解与认知,就必须要依靠如何训练专门的算法来处理领域问题。事实证明,我们的做法获得了良好的市场反馈和收益,并且在资本市场也备受关注。
生成式人工智能和通用人工智能时代是 AI 3.0 阶段。算法很重要,数据也不可或缺。最近有两家明星企业很受关注。一家企业不久前成功融资 100 亿美元。另一家企业市值已接近 3000 亿美元。我们坚信数据与 AI 紧密相连,若二者分离,就像拿着 AI 这把锤子盲目地找钉子。数据是对场景的一种抽象体现,AI 是一种工具,只有将两者结合起来,才能够产生价值,这便是中科闻歌商业模式的核心所在。
我创业到现在已经有 7 年了。头部客户的续约率几乎达到了 100%。有连续签约 5 年的客户,并且这类客户占比很大。所以,在行业从业者以及客户群体当中,积累了一定的声誉。然而,在面向公众的 to C 业务方面,还需要等待合适的时机来推出普惠的 C 端产品。
从科学家到创业者
《中国企业家》询问:你从 2017 年开始创业。在这之前你是一位科学家。2017 年的时候,人工智能浪潮还没有真正地兴起。并且恰好处于两个波峰之间。那么,你为什么决定出来创业呢?
王磊当时在中国科学院担任副教授级科研人员,属于科研骨干。2016 年,他们迎来了中国科技成果转化的春天,国家推出了促进科技成果转化的相关举措,其中中国科学院率先开展了技术加团队的创业。2017 年,有 5 名青年科研人员开启了创业征程,我和罗引博士是其中的核心成员。在实验室的时候,我们就希望做技术不能仅仅停留在写文章上,而要在实际应用中产生价值。那时,大家都才 30 岁出头,心中怀揣着用科技成果干一番事业的热忱,干劲非常足。
前期积累极为重要。我们的队伍在成长过程中,很大程度上受益于海外归国教授带回的先进学术思想。其中一位是卡内基梅隆机器人学实验室的博士,另一位是南加州大学人工智能的博士。他们帮助我们夯实了技术底蕴。我在 2007 年加入了这个团队。在这 10 年里,我积累了前沿的产业实践经验,也积累了全球前沿的学术思想,还积累了国家科研殿堂的积淀,同时也有了丰富的国家项目锤炼经验。这些经验让我们收获了一批种子客户。
《中国企业家》:你刚才所说的是宏观方面的背景,然而创业对于个人而言也是一个重要的决策。
王磊认为,在做决定的时候,倘若想太多,就难以作出决定。中国科学院的科研条件很不错,能够与优秀的同事一起共事,这让人感到舒心。然而,一旦决定了,就会比较坚决。第二天,他就把办公室交了回去,走出了实验室,并且很快拿到了第一笔天使投资。
《中国企业家》:当时你的第一款产品是什么?
王磊称我们遇上了极为良好的机遇,那便是国家的融媒体建设。中国日报以及新华社等国家级媒体都将其当作科研任务。融媒体业务包含图、文、音、视频,并且还有大量的 AI 工具以及数据分析需求。现实需求与国家政策的助力相结合,很快就找到了业务的落地场景。
后续涉足金融领域沿用了这一思路,找到技术与金融的契合点,催生出产品。后续涉足医疗领域沿用了这一思路,找到技术与医疗的契合点,催生出产品。后续涉足能源领域沿用了这一思路,找到技术与能源的契合点,催生出产品。道理大家都明白,但在实际操作中,让客户一年年买单并形成持续可增长的收入,还是非常有挑战的。
《中国企业家》:科学家转型做销售,那么说服客户的过程艰难吗?你是在帮他们赚钱,然而实际上你也是要从他们那里赚钱的。
王磊说他们现在的营收已经达到了几亿的级别,当时他自己也不敢相信能够做到这一步。他还记得自己曾经询问朋友是否适合创业,而朋友却告诉他不适合,原因是他长期在科研机构工作,可能会有点清高。
所以我出来之后时刻在提醒自己,要把身段放下来去聆听市场的需求。有一位基层员工曾经跟我讲过,“你们这些高层次的技术人才来研究我们这样一个属于小众的行业,并且还是处于转型期的行业,这让我们感到非常兴奋。”有时候客户所需要的并非是极为高深和顶尖的技术,而是更需要站在他们的角度去解决真正的工作或业务方面的问题。
后来从事县级融媒体工作,我前往了中国众多的县市以及基层地区,其中包括新疆、西藏、黑龙江等地。作为创始人,我具备吃苦精神,这种精神对员工开拓疆土起到了很好的鼓励作用。通过这些经历,我明白了创业不能仅仅盯着大行业,而应该在一个小的细分行业中找到真实的客户需求,锻造自身的技术能力,然后再将其泛化到其他行业,从而找到生存之道。
《中国企业家》:既要上天,又要入地。
王磊表示,在技术创业方面,首先技术必须要立得住,同时还要接地气。有一些企业立得过于深入,一旦天上出现任何变化且未及时跟进,就会被抛弃。登天本身已经是一件很困难的事情,而入地则需要真正俯下身来,一步一个脚印地去行走,会让人发现入地比登天更加困难和痛苦。
创业中的关键时刻
《中国企业家》:你决定做雅意大模型,是不是一个关键节点?
王磊表示,在决定做雅意大模型的时候,公司已经成为成长型、规模化的企业。投资人期望公司能够尽快迈向资本市场,达成规模化的商业效益,并且能够拿出令人瞩目的财报。在那个时候,公司也正在朝着这个目标不断前进。
2022 年它问世后,我们敏锐地察觉到这是一次不同寻常的技术变革。于是我们迅速采取行动,还记得那时购买 A100 一台还不到 70 万元,之后价格飙升到 185 万元一台。我们果断做出决策,构建了算力平台,从而拥有了非常稳定且可控的算力支撑。
2023 年 3 月,我们决定投入大模型研发。那时,从数据集构建到基础训练这一过程中,能够借鉴的文献案例极少。训练持续了 6 至 9 个月,算力成本高达几千万,再加上人力成本,财报方面承受着很大压力,与资本市场的期望相差甚远。
这是一个关键时刻,不采取行动就会导致技术落后,之后可能连参与竞争的资格都没有。而采取行动则意味着会面临财务方面的压力。我还记得在 2023 年的股东会上,大家都给予了很大的压力。到了 2024 年年底,我们在客户方面的竞争力以及客户对我们的信任等方面都有了显著的提升。都说存在数据、模型与决策的关系,大模型在理解客户需求方面能起到很大作用,在解决问题方面能发挥很大功效,在利用先进技术进行相关工作方面能提供很大助力,而收入的增长也证实了这一点。
《中国企业家》:这需要很大勇气。
王磊称,在 AI 产业变革处于关键节点之时,组织惯性的利弊变得格外明显。我们在 AI 行业已经深耕多年,是从实验室开始起步的,如今已蜕变成了 AI 创新企业,这其中凝聚着 60 后、70 后、80 后、90 后四代人的辛勤付出。组织形成惯性后存在优势,但也必须不断谋求变革。过去 20 年被回顾,很多信息化企业表现出色。然而,在 AI 技术投入方面,他们却没有迈出勇敢的一步。他们过于注重财务表现,只关注能否持续盈利以及亏损是否减少。正因如此,投入大模型就需要更大的勇气。
《中国企业家》询问:当时的你很难确切地认定一定会在大模型上取得成果,那么这种带来的内心的纠结该如何去化解呢?
王磊表示,想好了就应大胆去做,决定行动之后效率颇高,并未浪费过多资源,节奏既有计划又很紧凑。之后我们还进行了开源,给社区做出了很大的贡献。在 6 月份发布了 1.0 版本,12 月便发布了 2.0 版本,最近更是超越 GPT - 4o 进入了权威榜单的全球前十。
《中国企业家》:在早期预训练的过程里,对于一家创业公司来说,试错的成本是比较高的,并且每天还得持续地花钱,那你有没有经历过压力很大的时刻呢?
王磊称,当时的技术路线存在很大的不确定性。数据的工程配比对 AI 大模型的训练结果起着决定性作用,任何一个小的差错都可能影响训练进程。在训练雅意 2.0 时,确实有一段时间,同事发现 LOSS(回归误差)每天都在异常波动,导致大家都睡不着觉。一天租用显卡的费用就如同一辆宝马的价格,造成了几十万元的损失。最终,通过与算力平台一起努力攻关,才解决了这个问题。
因为这次,我对这些公司十分佩服。他们承担了很大的投入压力,毕竟不确定性是非常大的。
《中国企业家》询问:在决策智能领域,你们所具备的差异化竞争优势究竟是什么?
王磊称,过去在人工智能行业中存在这样的共识,即依次经历从感知到认知,接着到决策,而后到具身执行的过程。过去 AI 主要聚焦于产业领域。当年的四小龙在感知层取得了卓越的成果。认知这一层随着 GPT 的发展有了很大的变化。但我们必须明白,世界是动态、变化且复杂的。开放场景需要达成决策的智能化。因为对于人类或社会生产活动来说,错误决策可能会引发巨大的灾难性后果和损失。
我认为在具备基础认知和推理能力之后,对于复杂问题,需要具备动态实时的感知能力、长程规划能力以及决策支持能力,这是需要突破的要点。我们的决策绝非仅仅是简单的数据统计,而是要从复杂的异构数据中,借助 AI 去发现其中的规律,再依据这些规律并结合动态实时数据,利用 AI 进行推理和推演,以此来支持最终的决策选择。
《中国企业家》:你预测行业可能会发生哪些变化?
王磊称:其一,从技术层面来讲,将会出现更优良的降维 Law 等强化学习方面的技术革新,特别是在少量语料的生成领域,有望探寻到更具创新性的办法。当拥有更优质的基础模型之后,类似这种具有影响力的行业级创新,将会加快涌现出来。
第二,我认为 2025 年全球人工智能应用市场已抵达爆发的节点。这为市场带来了巨大的激励与推动。拥抱 AI 并非是“要不要去做”,而是“如何去做”。各个行业的产品将会如同移动应用般爆发,同时也会给端侧设备带来新的机遇。
第三,在算力这一方面,超强的算力有进一步发展的可能,市场的需求也会进一步得到释放,端侧的算力芯片或许能够孵化出下一个类似于英伟达的存在。
此外,从个人角度来看,我们应当加快拥抱 AI 的步伐。我坚信,在未来,懂得 AI 的人和不懂得 AI 的人,他们的人才价值会存在很大的差异。
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-888866601
电子邮件
wx888866603@qq.com
扫码二维码
获取最新动态