明敏 鱼羊 发自 凹非寺
量子位 | 公众号
就在今天,快手正式对外官宣了自研芯片的进展:
云端智能视频处理的 SoC 芯片已经完成了流片这一动作,并且目前正在开展线上内测的工作。
快手高级副总裁、业务负责人于冰介绍快手自研芯片情况
关键是,随着这一波造芯成果而来的,还不只一个大动作。
快手在业务上开启了与以往完全不同的尝试,更确切地讲是这样的。
这宣告着快手进军云服务市场。
快手ToB第一枪:
要说清楚这事儿,咱们得先来看看快手这个究竟是怎么一回事。
可以说是一套涵盖底层基础设施以及上层场景解决方案的“视频操作系统”。
其能力主要体现在和AI两个方面。
其中,侧重视频制作、传输、分发在内的全链路视频能力。
AI侧重智能视频创作、智能视频内容理解、数字人等技术领域。
快手视频云服务的雏形最早诞生于自家业务之中,这与许多云服务商的情况相似。
快手在 2015 年时日活跃用户数为千万级。到 2022 年第一季度,日活接近 3.5 亿。这期间,快手面临的是内部业务的爆炸式增长。
因此,快手的技术中台化进程也开始得很早。
中台化的意思简单来讲是,在各个不同的业务之间,去搭建起共享且共用的基础设施、底层的算法以及应用服务。
这些通用技术在不断地迭代升级,通用基础设施也在不断地积累拓展,并且逐渐被打磨出了更高的应用效率,此时一个“云产品”的雏形实际上就已经形成了。
具备这样的技术基础之后,随即出现了两个合作案例,这两个合作案例进一步催化了快手的 ToB 业务。
第一个合作案例出自学界。在疫情期间,高校对于线上教学平台的需求全面显现出来。其中,与快手有着深厚渊源的清华大学也在其中。
疫情刚开始的时候,清华邀请了快手。清华邀请快手是为了与快手的在线教育平台“学堂在线”达成合作,目的是满足老师和学生们的线上教学需求。
这可以说是快手首次将直播技术能力完整对外输出,效果很显著:
这些技术的应用为清华的网络课程创造了更好的体验。
第二个合作案例,则是知乎。
2020 年,知乎开始加快媒介的升级步伐。它强化了社区里图文与视频的相互融合。
该合作项目负责人介绍说,当时知乎处在媒介升级的初期阶段。他们注意到平台上的用户有着对视频质量和体验提出更高要求的诉求。
知乎在寻觅外部合作伙伴的时候,因为对快手音视频技术有所了解并且予以认可,所以主动与快手的有关技术部门取得了联系。接着,双方开展了多轮技术研讨,最终明确要围绕视频架构的升级以及体验的优化来展开深度合作。
快手输出了一套完整的点播云解决方案。它通过媒体处理服务、融合 CDN、播放器等产品,并且结合热度触发、多码率自适应等策略。逐步地,快手帮助知乎解决了用户体验提升和云服务成本优化等需求。除此之外,针对知乎在媒介升级中不同阶段的痛点,快手也提供了专业的技术咨询服务。
通俗来讲,快手的这一系列举措,一方面可以保障视频的画质,另一方面能让视频的播放更加流畅,同时还能使视频文件变小,进而降低存储成本。
经过这两个案例的打磨,快手在对外提供服务方面,其产品能力得以提升,工具更加完备,体系也更为完善。
更重要的一方面是,一个全新的商业模式正在逐步被验证。
快手的高级副总裁、负责人于冰进行了透露。他指出,虽然市面上已经存在不少视频云产品,但是在传统模式之下,行业一直存在着一个根本性的矛盾。
客户视频码率越高,带宽用量越大,云服务商营收往往越高。
如果视频压缩技术得到了升级,客户将从中获益。其一,C 端的用户体验会更加流畅;其二,带宽成本也会大幅度降低。不过,厂商的营收会受到很大的影响。
视频云厂商因此缺乏足够动力,不会为客户提供更先进的视频压缩和传输技术。
快手自身是国内头部视频平台之一。追求用户体验提升和带宽成本优化,这件事本身收益极高。所以快手自然有很强的动力去打磨视频压缩技术。
实际上,快手已经引入了许多行业顶尖的人才。并且,快手在实践中已经掌握了行业领先的视频压缩技术。
在新一代视频压缩国际标准 H.266/VVC 的制定过程里,快手有很多技术提案被采纳,数量达到数十件。
快手首席技术官陈定佳表示,技术toB是快手长期坚定的方向
快手在与知乎探索出一套双赢的合作模式之后,便开始加快自身核心技术能力向外部开放的步伐,期望能将新的商业模式推广至全行业。
于是,应运而生。
能做什么?
说了这么多,到底有何不同之处?
前文提到,主要提供的是全链路的视频能力,同时也提供覆盖视频创作全流程的 AI 能力。
快手将这些技术能力的核心价值总结为 4 个 E,其中包括创新这一方面、体验这一方面、弹性这一方面以及经济成本这一方面。
第一个 E 是用于创新的,其目的是协助企业从无到有地迅速搭建视频业务,或者让业务能够快速实现创新。
从上述架构中能够看出,点播云、直播云、媒体处理、音视频 SDK、移动端组件库等产品位于 - 中,这些产品能够构建出一个完整的“端云一体”方案,能够让行业客户一站式快速搭建视频业务。
第二个E是体验()。
在这方面,快手运用了超分辨率等一系列智能算法,还叠加了视频插帧等算法,同时有 SDR 转 HDR 的功能,以及 3D 环绕声,并且具备去噪和去模糊的能力,这些算法能结合源片的特征,从而实现视觉和听觉全方位的修复增强。
可以实现 4/8K 的观感,其精细程度达到毛孔级;能够达到 60/120 帧的帧率;具备全景声的立体音效;拥有高动态对比度;具备宽色域等效果。
从数字指标来看,硬解覆盖率在 95%以上,首屏时间得以控制,带宽利用率超过 90%。
值得一提的是,一般来说只有行业里处于领先地位的平台才能够达成“零首屏”的体验。快手也将这样的能力向行业内的用户进行了开放。
第三个E是弹性(),实际上也是弹性规模( )。
这一点对于快手而言,已经有过多次验证。
快手曾经赞助过春晚抢红包活动。有几亿人同时在观看同一条视频,并且还要完成抢红包这个动作,当时在线的人数达到了 2250 万人。
这对于带宽的要求非常高。
于冰透露,快手的带宽量级达到了 100T 这个级别,存储量达到了 EB 级别。每天处理的视频数量达到了几千万条,视频的播放量达到了几百亿。
因此,对于快手来说,弹性规模是一种与生俱来的能力,并且这种能力也将成为一种优势。
第四个E是经济成本、成本最优()。
上云是大势所趋,但成本也必须考虑。
海量高质量视频进行传输分发时,会对带宽和存储产生极大的消耗,而这背后是需要投入大量资金的。
在这方面,拿出了多项自研技术,以进一步降低成本。
在相同画质的情况下,与开源的 X265 方案相比,自研的 H.265 能够使压缩率提升 30%-40%,KVC 能够使压缩率提升 50%-60%。
通过 CDN+PCDN 解决方案,在多云融合架构的环境中,当各类体验指标保持持平状态时,带宽成本能够节约 30%以上。
另外,如同开头所说,快手为了使视频压缩率得到进一步提升,竟然还自己研发起了芯片。
于冰透露,快手为了此事,专门邀请了在视频硬件领域的顶级算法专家来组建研发团队。
以上4个E的价值也在的AI技术能力模块得到体现。
快手上每天会有大量的视频内容产生。每个视频在平台上都要历经内容创作这个环节,还要经历理解环节以及分发环节。在助力创作者能更便捷且智能化地进行视频内容创作方面,以及在对海量视频内容进行结构化管理方面,AI 都起着不可或缺的作用。
快手在提升视频创作效率方面提供了丰富的产品服务。快手在构建视频内容结构化系统方面提供了丰富的产品服务。快手在进行业务赋能方面提供了丰富的产品服务。快手在进行营收赋能方面提供了丰富的产品服务。
快手的 AI 美颜功能是最为大众所熟知的能力之一,它能帮助行业在视频化转型升级过程中提升视频生产的效果。快手的海量魔表特效也是最为大众所熟知的能力之一,它同样能帮助行业在视频化转型升级过程中提升视频生产的效率。快手的一键成片的智能视频创作功能也是最为大众所熟知的能力之一,它也能帮助行业在视频化转型升级过程中提升视频生产的效果和效率。
用户借助最新发布的“文案成片”功能,只需给出一段文本内容,就能达成从纯文字内容到视频内容的自动化智能创作。此功能的背后,有着亿级别的优质版权素材,还有一套成体系的 AI 智能创作技术,其中包含跨模态图文匹配技术、全局一致性建模技术、智能配音技术以及配乐技术。
快手技术副总裁王仲远希望通过技术迭代来打通视频创作与文字创作之间的鸿沟,以降低普通用户进行视频创作的门槛,从而帮助更多用户能够更好且更快地制作视频。
快手的技术副总裁王仲远,他是 AI 技术及主站技术的负责人,他介绍了快手的视频 AI 能力。
快手以亿级视频当作训练样本,构建了百亿级多模态内容理解大模型( - for ),也就是快手 K7 大模型。此大模型能够智能地把百亿级视频压缩至一个数百维的向量表征的隐式空间里,还能够进行高效的视频相似度计算,进而为数百个业务场景赋予能量。
快手在显式的类目标签体系之上构建了百万级的标签体系。同时,借助跨模态兴趣标签与智能检索,能够实现更细分垂类的内容覆盖,从而实现标签体系与媒资管理、推荐系统的协同合作。
在底层技术积累之外,在应用和服务层面,推出了一个特色业务,那就是数字虚拟人。
依据应用场景可划分为3类:
在这方面,快手此前也有多方面尝试。
比如从几年前开始,A站虚拟人动捕技术就是由快手提供。
今年最高检推出的虚拟检察官,是由快手联合制作的。在视频里,虚拟人对最高人民检察院 2022 年工作报告进行了解读,这个解读时长大约 5 分钟。
王仲远进行了介绍,此次是面向行业的合作伙伴,快手正式把视频 AI 的三大类解决方案给发布了,分别是智能视频创作、智能视频理解以及数字人及 XR,他希望凭借这三大能力板块,能够让行业的视频数字化转型得以加速。
快手ToB,为什么是现在?
用于冰的话说,“快手准备好了,这是做To B业务的前提。”
并且它正在迎来新一轮的技术方面的革新。
所以快手此刻进军ToB,由外及内,大致可归结为三方面原因。
其一,视频数字化已经是行业的大趋势。
王仲远认为,如今视频已经逐渐成为一种像基础设施一样的存在。如今直播也已经逐渐成为一种像基础设施一样的存在。
就像需要电力一样,各个行业也越来越依赖于视频化的表达方式。
于冰提到,5G 技术在不断发展。在这一发展过程中,用户的手机屏幕以及电视屏幕都呈现出变大的趋势。基于这种屏幕变大的趋势,对于用户来说,4K 以及 8K 的视频会逐渐变得平常且常态化。
对于视频行业的玩家们来说,在这样的技术升级背后,意味着视频码率(单位时间内视频的数据量)会提升很多,能提升 5 到 10 倍,那么对应的成本之高也就可以想象得到了。
在这种情形下,借助视频云服务来把成本控制住的这种需求,将会变得越来越强烈。
IDC 发布的《中国视频云市场跟踪(2021 下半年)》报告表明,2021 年下半年中国视频云市场规模达到了 50.4 亿美元。此规模同比增长了 32.7%。并且预计到 2026 年,市场规模将会达到 364 亿美元。
企业自身而言,从零开始构建一个视频系统,其难度是不能被小看的。
单从需要投入的金钱方面来看,就足以令人望而却步。
这些能力是快手当下所具备的,并且已经实现了中台化,能够外放给更多的行业。
这体现了快手进军 ToB 的一个方面原因,那就是自身技术有底气对外进行开放。
快手技术到今年已有 11 年的积累沉淀。快手技术长期经受海量数据的考验。
据悉,快手平台现今每天需承载 3.46 亿的整体日活量。并且,每日上传的视频数量达到了数千万个。
视频汇聚和分发的背后,有多达 3000 余项 AI 服务在提供支撑。每天这些 AI 服务的调用次数超过 4500 亿次。
这背后,当然离不开在技术研发上的投入与布局。
2021年,快手在研发上的投入达到了150亿元。
它的技术团队在国际顶级的会议和赛事上多次获得大奖。例如在 2021 年的语音增强比赛中,快手曾经获得了两项第一名。
此次平台,还实现了从底层到顶层99%自研自建。
正如前面所提到的,快手也逐渐意识到了技术的“普适性”。
他们在过去几年开始与一些企业进行合作,并且是尝试性的合作,以此来验证 ToB 的可能性。
知乎和多多视频等多家标杆客户对其进行验证后,快手最终确定自家技术能够帮助不同行业,因此推出了此次产品。
这一动作实际上与它“专注、专业、极致、可靠”的技术理念是相契合的。 这一动作和它“专注、专业、极致、可靠”的技术理念相契合。 它“专注、专业、极致、可靠”的技术理念与这一动作相契合。 这一动作与“专注、专业、极致、可靠”的技术理念相契合。 它的技术理念“专注、专业、极致、可靠”与这一动作相契合。
由此引出了快手进军ToB的第三层动因。
普惠平等,是快手在ToC方面一直坚持的事情。
王仲远称,快手的技术现今具备适配 10 万款手机机型的能力。这使得高端旗舰机型的用户以及普通机型的用户,都能够体会到 AI 的能力。
现在推出,是这一理念推及到ToB侧的体现。
快手提出,要把互联网视频“重工业”转变成“轻工业”。
也就是将行业技术门槛、成本门槛都进一步降低。
互联网能够快速接入 AI 方面技术,传统行业也能够快速接入 AI 方面技术。这样可以缩短视频数字化转型的周期,同时也能够减少成本支出。
与此同时,快手还提供有专家顾问天团。
即使行业客户没有组建自己的视频团队,也能够协助其构建起视频化的任务。
快手表示,对于自建了音视频团队的客户,它将遵循开放共享的原则,展开更为深入的合作探讨,其中涵盖代码级以及文档级的技术共享。
总的来说,快手的技术要从内部流向各个行业,这是其品牌理念,并且也是其名字的由来。
核心能力宛如细细流淌的涓涓细流,下游场景恰似广阔浩荡的大江大河。它将技术进行汇聚并且进行分发,正因如此才被称作“”(溪流湖)。
“慢棋”非慢
在这个时间节点宣告要进军视频云赛道,快手所面临的质疑其实是有不少的。
最大的质疑声音,就是这一手棋,快手是不是下慢了。
但前文曾提到,这招“慢棋”,实际上是下在了一个较为合适的时间区间内:
一方面,视频云领域竞争激烈,但客户需求仍未被很好地满足。
一方面,4K/8K 技术发生了变革。这一变革已经给视频行业带来了新的挑战。同时,这一变革也为视频行业带来了增长的契机。
快手此次宣布进入 ToB 赛道,拥有芯片并且拥有数字人,然而更长远的价值或许才刚开始显露一点点。
为什么这么说?
快手的技术负责人们称,在内部方面,迈出 To B 这一步,意味着快手的技术往后能够在外部获得进一步的验证,能给技术人员们带来更直接的市场反馈,这有利于推动创新。
对外而言,面对这样一个规模在不断扩大的市场,降低技术门槛已成为众人所期望的事情。
快手参与进来,给市场带来了一整套既成熟又经过市场验证的技术方案,同时也带来了一种全新的商业可能性。
如此一来,市场的选择变得更加多样了。同时,行业在降本增效方面也就越“卷”,越能展现出其看头。
视频时代的互联网正在成为“重工业”,客户们急切地希望能够降低视频化的投入成本,也希望能够以更少的投入来支撑更优质的体验,而这正是一个可以撬动的机会。
—完—
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态