机器之心发布
机器之心编辑部
腾讯优图实验室与厦门大学人工智能研究院联合发布了《2021 十大人工智能趋势》报告,这份报告对 3D 视觉技术的发展趋势进行了预测,对深度学习算法的发展趋势进行了预测,对人工智能内核芯片等众多领域的发展趋势也进行了预测。
6 月 5 日,2021 年的全球人工智能技术大会(2021)在杭州举行。此次大会汇集了人工智能产学研各界的领军者。他们以国际化、前瞻化、产业化的视角,对新一代人工智能的发展路径进行了解析和洞察。
腾讯优图实验室在大会上与厦门大学人工智能研究院联合行动。他们正式推出了《2021 十大人工智能趋势》(即“趋势报告”)。凭借双方长久以来对人工智能,尤其是计算机视觉的研究与洞察,对 3D 视觉技术、数字内容产业、AI 深度学习算法、人工智能内核芯片等诸多领域的发展趋势作出了预测。
趋势报告指出,深度学习在多个人工智能细分领域(像视觉、自然语言处理等)日益成熟且规模扩大,多模态融合成为实现通用人工智能的必然之举,人工智能会从感知智能迈向认知智能;与此同时,算法和硬件能力持续升级,3D 视觉智能技术能推动商业发展与个人消费升级;深度学习走向多模态融合,边缘计算和人工智能加快融合,AI 算法的公平性研究将促使 AI 应用走向普惠。
以下为《2021 十大人工智能趋势》详细内容:
1、自动机器学习的自动化程度与可解释性得到进一步提升
自动机器学习目前已在多个领域初步实现对机器学习方法的自动化设计过程。但它仍存在自动化程度不够以及可解释性不强的问题。例如,神经网络结构搜索在一些应用领域达到了可与人类机器学习专家相比较的水平,然而现有的神经网络结构搜索方法实际上需要基于人工设计的神经网络基础结构。此外, 的自动化过程常被视为一种“黑箱”,且缺乏可解释性。今后,自动化程度与可解释性依然是 研究的热点问题。通过提升 中的超参数选择、特征表示以及机器学习算法的确定和神经网络结构搜索的自动化程度与可解释性,就能实现对机器学习所涉及的每个环节进行真正的自动化设计过程。整个体系架构在不断趋于完善。这会推动新一代普适性平台的建设,同时也能够实现机器学习的大众化。
2、无监督 / 弱监督学习逐渐成为企业降本增效新利器
过去几年里,深度学习取得了巨大成功,这离不开大规模标注的数据集。传统的监督学习要求每一个训练样本都有完备的标签,而大规模标注正是基于此。随着业务规模不断扩大,越来越多的企业意识到,数据的标注开始成为抬高交付成本以及制约效果提升的主要因素之一。在此背景下,无监督学习通过不使用标签来降低深度模型对数据的标注需求,使得原本无法利用的数据如今可以加入到模型训练中。同时,弱监督学习通过减少对标签数量、质量的要求来降低深度模型对数据的标注需求,也让原本无法利用的数据能够加入到模型训练中。进而由量变引发质变。在自然语言处理(NLP)领域,基于某种方式的无监督训练模型一直占据各种 NLP 任务数据集的榜首;在计算机视觉(CV)领域,最新的 MPL 方法借助额外的无标注数据集,首次把某个指标的 Top-1 分类准确率提升到了 90%以上的水平。可以预见,会有越来越多的人工智能企业面临一个新阶段,即从前期的迅速扩张过渡到稳定期的高效化运作。在这个过程中,无监督 / 弱监督学习将成为它们过渡到这个阶段的重要手段之一。
3、3D 视觉技术助力产业消费升级,淡化虚实边界
3D 视觉技术是视觉 AI 领域多年的热点研究方向之一。其核心任务是对三维空间、物体及环境进行真实还原与重建。随着相关算法与硬件计算能力不断升级,3D 视觉算法效果有了大幅提升。三维几何重建变得更加精细,表面纹理重建更加清晰,从而带来了更加逼真的视觉观感。近年来,很多 3D 视觉方面的研究成果给低成本且高质量的 3D 内容生成提供了不错的技术支持。基于 3D 虚拟形象的舞台演出不断涌现,直播带货也在不断发展,教育互动等应用更是层出不穷,这些都成为了 AI 内容产业全新的发展方向。以此为基础,5G 时代流量带宽实现了全面升级。带有交互功能的 3D 虚拟现实、增强现实、混合现实的 3D 视觉应用,将用户体验朝着真实与虚拟完美融合的方向进一步推进。用户会因虚拟偶像舞台表演的生动自然而进行打赏,会由于虚拟主播“卖力”带货促销而下单购买。线上平台依靠 3D 视觉技术,大大降低了内容制作和 IP 运营成本,最终带来了社会商业发展模式的颠覆与变革,以及个人消费习惯的颠覆与变革。展望未来,3D 视觉技术会在众多领域持续广泛应用,比如游戏娱乐领域、影视制作领域、电商直播领域、医疗整形领域等。同时,虚拟与现实的边界会不断地淡化。
4、多模态融合加速 AI 认知升维
深度学习在多个人工智能的细分领域,像视觉以及自然语言处理等方面,已经逐渐变得成熟且规模增大。然而,若要切实达成通用人工智能,就必定要把这些细分领域各自所针对的信息模态进行整合并加以利用,也就是要实现多模态融合。多模态融合的目标是基于图像、文字、语音等多模态信息的识别。它要实现不同模态信息的统一表征框架,这样就能起到 1+1>2 的效果。其中一个典型场景是通过图文语音联合识别,来实现对隐晦和暗示性的招嫖广告以及儿童不良表情包等图文混合内容的识别,以支持审核业务对不良内容进行深度打击。除了图文融合这类跨域模态融合之外,同域内不同的信息维度也能够进行融合。随着深度生成技术不断发展,当前的人脸识别,除了有传统的 RGB 图之外,还需要将深度图、红外图等信息融合起来,这样就能更好地防御越来越多元化的人脸伪造攻击,从而实现更强的人脸防御。人工智能认知能力提升后,多模态融合会从图文等实质性模态开始,逐渐拓展到物理关系、逻辑推断、因果分析等知识性模态,进而从感知智能迈向认知智能。
5、人工智能推动数字内容生成向新范式演进
数字文化产业蓬勃发展,二次元文化渗透出圈。数字内容产业迎来新一轮需求升级,5G 商业化进程不断加深,多元化、精品化的优质数字内容消费节奏加快。与此同时,供给侧存在巨大产能缺口,数字内容产业正处于从劳动密集型向科技密集型的转型阶段。AI 与数字内容产业深度耦合,有望为行业释放更大科技势能。以 GPT-3、DALL-E 为代表的 AI 技术,在文本、语音、图像、视频等内容生成中取得了惊艳成果。然而,在精确性、泛化性、合理性方面,仍面临挑战。目前的前沿研究,一方面探索从模型结构(如自动化搜索等)、训练形式(如无监督对比学习等)等方面提升精度效果;另一方面引入知识图谱领域知识,向机器介绍常识和其他特定领域知识,以提升常识推理效果。技术持续升级演进,我们预见 AI 会在数字内容生成领域逐渐释放出像引擎一样的影响力。在内容、平台、技术等多方面合力的引导下,能够构筑起数字内容生成的新范式。
6、边缘计算与人工智能加速融合
近年来,深度学习算法迅猛发展。计算机视觉、自然语言处理、搜索推荐广告等各种领域的任务性能不断被刷新。同时,边缘智能设备广泛普及且硬件得到改进。基于深度学习的人工智能技术在边缘端应用落地成为了可能。然而,在边缘端部署深度学习模型难度很大。它的主要挑战体现为,边缘端这类智能设备在计算、存储以及功耗等方面存在着很大的限制。所以,边缘端的模型一定要满足低计算复杂度、较小的模型尺寸以及低模型功耗等要求。未来将会趋向于硬件友好型的剪枝加速。依据边缘硬件的 CPU 类型去设计特定的网络稀疏化模式,使能不同硬件的模型压缩与优化加速技术,这是未来的研究热点趋势。其次,自动化的 1-bit 量化方法在理论性能方面有很大提升,提升幅度达到上百倍。所以,它也是未来研究的热点趋势。
7、人工智能内核芯片向类脑神经计算方向演进
人工智能内核芯片已是人工智能时代的关键技术之一。在某些领域的具体任务中,人工智能内核芯片能有超越人脑的表现。然而,对人工智能内核芯片的研究仍落后于人工智能的发展。人工智能内核芯片无法同时满足多种人工智能算法的加速需求。面对各种新型人工智能技术不断涌现的情况,人工智能内核芯片与人脑相比,其自我学习能力和可扩展性存在明显不足。未来人工智能内核芯片在结构方面会更趋近于人脑的神经构造,进而获得类神经计算的能力。随着不断整合最新的人工智能技术,定制型人工智能内核芯片会逐步演变成通用型人工智能内核芯片。在这个过程中,它既能提高自我学习能力,又能实现对不同人工智能技术在不同任务上的加速计算,以此推动人工智能内核芯片真正实现落地。
8、算法公平性研究推动 AI 应用走向普惠无偏见
因为存在数据偏差、算法本身的缺陷以及人为偏见,所以现有的 AI 算法普遍在对于某些特定人群的效果上存在不公平的“歧视性现象”。随着 AI 算法在社会各行业广泛地落地应用,它作为辅助人们决策的重要工具,其公平性问题正获得越来越多的关注。过去几年,业界在逐步探索一些针对性的解决方案。这些解决方案包括构建更公正的数据集,在算法训练中引入公平性约束损失,以及提高机器学习算法的可解释性等。但整体来看,当前公平性研究在精度和公平性的平衡方面,以及在不同场景的泛化性有效性等问题上,正处于蓬勃发展的阶段。欧盟发布了《人工智能白皮书》以及《人工智能伦理: 问题和倡议》,与此同时,中国发布了《协同落实人工智能治理原则的行动建议》。在这样的背景下,人工智能的治理正逐渐成为一个备受关注的热门议题,其中算法的公平性乃是人工智能治理的关键所在。我们预见算法公平性的研究将会不断深入。在人脸识别等广泛的 AI 应用领域,会取得突破。从而为不同人群带来更加普惠且无偏见的效果。
9、隐私保护 AI 落地实用帮助算法可持续进化
人工智能和机器学习算法得到了广泛应用。它在给人们带来便利的同时,也带来了很大的隐私泄露风险。这种隐私泄露的情况有,用户数据在授权范围之外被处理和共享,以及机器学习算法训练后存在数据记忆等现象。AI 算法开发中数据隐私保护问题受到的关注在不断增加,监管力度也日益加大。2020 年,美国生效了《加利福利亚消费者隐私法案》,中国公布了《个人信息保护法(草案)》。针对机器学习中的这些隐私保护问题,近年来研究工作逐步深入并走向成熟,进而发展出了数据匿名化、联邦学习、差分隐私等一系列方法。我们预见,更加灵活高效的 AI 学习方法能够保护用户数据隐私,这种方法将在金融、医疗、社交等场景实用化落地,从而消减用户的隐私担忧,帮助 AI 算法在场景中可持续地进化。
10、人工智能技术向安全智能方向迈进
人工智能技术在各行各业得到广泛应用。滥用人工智能系统会给社会带来负面影响。恶意破坏人工智能系统也会给社会带来负面影响。近年来,针对人工智能算法的攻击技术不断发展,如算法后门攻击、对抗样本攻击、模型窃取攻击等。这些攻击通过篡改和构造特殊数据,诱使人工智能应用产生不可信的错误结果,从而带来了更大的算法安全风险。因此,保障人工智能应用安全可靠的需求变得日益迫切。未来人工智能技术会持续朝着安全智能的方向发展。一方面从算法的可解释性方面着手,以此来提升模型的鲁棒性。另一方面将被动转为主动,借助主动安全检测机制去侦测和拦截各类攻击。最终达成人工智能可用性与可信性双轨并重的现实需求,促使人工智能技术在更广泛的领域安全落地。
腾讯优图是腾讯旗下的顶级人工智能实验室,它长期以来坚持基础研究和产业落地并行发展。它拥有超过 1000 项 AI 相关的国内外专利,有 300 多篇论文被 CVPR、AAAI、ICCV 等国际顶会收录。在产业落地方面,腾讯优图借助腾讯云持续输出顶尖的视觉 AI 能力,目前已经推出了超过 30 个行业的解决方案。
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态