首页/知天下事/正文
陈曦马库斯质疑DeepMind AlphaStar进化版,探讨未来通用智能研究的意义

 2025年02月19日  阅读 7

摘要:陈十一马库斯最近上了酒吧。在不久前质疑的“RudeCube操纵器”之后,最近提出了有关新推出的“2”智能演化版本的六个主要问题。这次,他的质疑不是游戏表现本身,而是指出更高的水平:未来一般情报研究的重要性。来自互联网的图像近年来最酷的人工智能来自...

陈十一

马库斯最近上了酒吧。在不久前质疑的“ Rude Cube操纵器”之后,最近提出了有关新推出的“ 2”智能演化版本的六个主要问题。这次,他的质疑不是游戏表现本身,而是指出更高的水平:未来一般情报研究的重要性。

来自互联网的图像

近年来最酷的人工智能来自深度强化学习

据报道,最近推出的新版本可以在与现实世界玩家的复杂场景互动中实现战斗。此前,美国的通用人工智能研究组织推出了一个新的机器人,该机器人结合了最新的AI算法,并通过机器独立学习,实现了“人类式”机器人的单手魔方。

这次推出的单手魔方机器人是使用专业算法解决特定任务的传统方式(如果您更改任务,仍然需要对其进行重新编程),而是通过某种学习方法进行的现实世界机器人训练,使机器人手能够学习人的手。最终到达,允许机器人像人类一样建模,并使用有关世界的同样直觉来做从开门到炸鸡蛋的所有事情。但是马库斯认为,对此结果的描述是误导性的,更合适的标题应该是“通过增强学习来操纵的立方体”或“用敏捷的机器人手操纵对象或类似句子的进展。

学习通人工智能_学习通人工智能_学习通人工智能

“马库斯()强调了'通过增强学习来操纵魔方'目前,人们认识到,最有可能实现现有技术的通用人工智能的技术。天津大学情报与计算系进一步解释说,机器学习目前分为三个主要分支,有监督的学习,无监督的学习和强化学习。深度学习属于监督学习中最主流技术。深度强化学习是深度学习和强化学习的整合,它将深层神经网络整合到增强学习框架中。

“近年来,深厚的强化学习已经迅速发展,并且在处理复杂,多方面和决策问题方面表现出了巨大的潜力。目前,深厚的强化学习技术主要用于某些游戏和竞赛。” Hao 介绍了2016年,GO ()击败了世界顶级GO球员Lee 和Ke Jie,这引起了人们的轰动,并成为人工智能领域的里程碑。核心是使用深钢筋学习算法,以便计算机可以通过自我游戏不断提高其国际象棋力量。此外,顶级专业球员在比赛中被击败。由CMU团队开发的德克萨斯州Hold'em AI冷拳手很容易击败顶级球员。

此外,深入的强化学习用于优化数据中心的能源消耗。 使用深度强化学习来完成对深神经网络的自动体系结构搜索,并提出非常酷的服务,从而促进机器学习作为成千上万公司的服务。一千户家庭。在我的国家,有许多深入加强学习技术的应用。阿里巴巴,腾讯,百度,迪迪和天兰等国内团队将对搜索,建议,营销,订单分配和路径计划等实践问题的决策任务应用深入的强化学习。

深度强化学习是实现通用人工智能的最可能技术

随着人工智能到当前高度的发展,最重要的贡献者应属于深度学习算法。深度学习使用多层神经网络从巨大的数据中学习,从而实现了对未来的预测并使人工智能系统越来越聪明。目前,安全监控,自动驾驶,语音识别,百度地图等。我们使用的都是深度学习技术在图像视觉,语音识别,自然语言理解等领域的应用。

强化学习也是机器学习领域的流行技术。与基于已知标签培训模型的监督学习不同,强化学习可以像人类一样实现独立学习,而无需明确的计算机说明。达到一定量的学习后,加固学习系统可以预测正确的结果。 “强化学习的基本思想是学习哪种行为可以最大程度地利用不同环境和州的预期收益。” Hao 介绍了该代理的新版本使用强化学习的自我对照技术,其学习过程不需要数据。注释由奖励功能主导。如果代理商获得奖励分数或赢得比赛,它将获得积极的反馈,而代理商将根据战斗的表现来调整他的行为。这就像一个婴儿学习走路,并会根据结果调整自己的行为。

目前,通用人工智能的定义具有两个主要特征:一个是端到端的学习,另一个是任务适应,它在不参与监管的情况下可以胜任不同的任务。深度强化学习可以将深度学习的感知能力与强化学习的决策能力相结合,并且可以根据输入信息直接控制。这是一种更接近人类思维方式的人工智能方法。在与世界的正常互动中,增强学习将利用奖励通过反复试验来学习,这与自然学习过程非常相似。例如,单手的魔方机器人可能需要使用深度学习图形识别技术和其他技术来查看的立方体,然后需要增强学习模型才能允许机器人在连续的试用和错误过程中独立学习。在加强学习中,可以使用较少的培训信息,这样做的优势是,它更有信息,而不是受主管技能的限制。深入的强化学习是建立对世界有更高了解的自主系统的又一步,这就是为什么当前深入强化学习被认为是实现现有技术中通用人工智能的最可能技术的原因。

学习通人工智能_学习通人工智能_学习通人工智能

人类仍然有很长的路要走要实现普遍人工智能

“尽管深度强化学习技术最有可能实现通用人工智能,但不能说可以实现它。我们仍然远离真正的一般人工智能。” Hao 说,深度学习和加强学习的结合是当时的结合,真实情况的枚举变成了对真实情况的第一个模式识别,然后是有限的模式枚举,从而降低了计算压力,从而减少所需的数据将比其他机器学习算法大得多。 。如果将场景扩展到多种代理的深入增强学习,则所需的数据和计算能力将成倍增加。目前,没有平台可以提供强化学习所需的巨大数据,并且不可能消耗现实中可能的相遇。各种复杂的情况。在许多现实生活领域都无法实现这种“饥饿”的数据。

例如,例如,增强学习需要大量反复试验。如果将单手的的立方体机器人应用于烹饪的真实场景,则可能将食材放在地板上,或者可能将一袋盐倒入锅中。这也可能引起大火。因此,在实际情况下无法实现反复学习模型。

此外,在机器学习领域,深度学习和强化学习是最难成功调试的。它的成功故事实际上并不多,但是一旦推出,它将引起感觉。但是,做了深入强化学习的科学家和工程师实际上知道这是一个可以极大地影响学习效果的模型框架。对于同一型号,训练10次可能会失败7次,3次可能成功。如此之多,以至于在深厚的增强学习圈中有一个自嘲的“种子工程”概念。此外,深入的增强学习及其容易过度适应代理商当前的相互作用环境,因此环境略有变化,以前看起来很出色的代理也可能会造成低级错误。

“当人类理解事物时,他们通常会使用数据来做出因果推理和判断来提出相应的解决方案。但是,当前的人工智能系统无法实现这种因果关系。” Hao 说,将来可能会使用通用人工智能。大脑的发展仍然需要基于脑科学的发展。我们对人脑的理解仍处于很早的阶段。大脑的机制,例如事物的认知过程,解决问题的过程和思维能力仍然不清楚。因此,人工智能的当前发展与这种可以真正模拟人类智能思维的通用人工智能还有很长的路要走。走开。

版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;

原文链接:http://wen.bjhwtx.com/post/4828.html

标签:

博览广文网

博览广文网为所有文学爱好者、新闻爱好者、关注生活多方面内容的观众朋友提供多方位的内容呈现、提升阅读空间、填充碎片时间,开阔读者的视野、增长见识、了解民生、一个让您不出户尽知天下事的网站平台!
热门标签
关于我们
广文舒阅网—让天下读者有家可归!这里汇聚了各类优质文化信息,无论是全球热点、历史故事,还是实用百科、趣味探索,您都能轻松获取。我们希望用阅读点亮您的世界,让每一次浏览都充满收获和乐趣。
导航栏A标题
广文舒阅网
扫码关注
联系方式
全国服务热线:0755-88186625
Q Q:8705332
Email:admin@lanyu.com
地址:深圳市福田区海雅缤纷国际大厦5层501
Copyright 深圳市蓝宇科技有限公司 版权所有 备案号:京ICP备20013102号-1