对话系统(对话机器人)本质上是关于允许机器通过机器学习和人工智能等技术理解人类语言。它包括许多学科和方法的融合,并且是一个在人工智能领域的技术集中训练营。图1显示了对话系统开发涉及的主要技术。
提高对话系统技能的方法
我们可以从哪些渠道了解图1所示的许多与对话系统相关的技术?解释在下面逐步提供。
图1对话系统技能树数学
矩阵计算主要研究单个矩阵或多个矩阵相互作用时的某些特性。各种机器学习模型涉及大量矩阵相关属性。例如,PCA实际上是在计算特征向量,而MF实际上正在计算模拟SVD中的单数值向量。人工智能领域中的许多工具都用矩阵语言编程,例如主流深度学习框架,例如等。有许多用于矩阵计算的教科书,只需寻找适合您的困难的教科书即可。如果您想深入了解,我强烈建议您建议“完成”一书。
概率统计是机器学习的基础。几种常用的概率统计概念:随机变量,离散随机变量,连续随机变量,概率密度/分布(二项式分布,多项式分布,高斯分布,索引家族分布),条件概率密度/分布,先验密度/分布,后部密度/分布/分布,最大似然估计,最大后验估计。如果您有一个简单的理解,则可以阅读经典的机器学习教科书,例如“和”的前两个章节“:”。如果您系统地学习,则可以在该大学中找到概率统计数据中的教科书。
优化方法广泛用于机器学习模型的培训。机器学习中的几个常见优化概念:凸/非凸功能,梯度下降,随机梯度下降和原始双重问题。通常,机器学习教科书或课程将教您一些优化知识,例如Zico的“” NG机器学习课程。当然,如果您想系统地理解它,最好的方法是阅读博伊德的书“”,以及相应的PPT(〜Boyd //)和课程(,)。喜欢阅读代码的学生还可以看一下开源机器学习项目中涉及的优化方法。例如,这是一个不错的选择。
一些常用的数学计算软件包:
机器学习和深度学习
NG的“”课程仍然是机器学习领域的介绍工具。不要低估所谓的入门级。如果您真的在这里完全了解知识,则可以申请算法工程师的位置。我推荐几本公认的教科书:“ of”,“ of”,“”,“”,“ A”:和Zhou 的西瓜书“机器学习”。深度学习材料建议以及其他“深入”和官方教程。
一些常用的工具:
自然语言处理
许多大学都有与NLP相关的研究团队,例如 NLP集团和国内理工学院Scir实验室。这些团队的动态值得关注。
与NLP相关的信息可以在互联网上到处找到。斯坦福大学推荐的课程为“:具有深度”和“ of”(中文版本称为“统计自然语言处理的基础”)的书。
在信息检索方面,推荐的经典书“ to”(中文版本的信息检索简介”(由王本先生翻译)和斯坦福课程“ CS 276:和Web”。
一些常用的工具:
对话机器人
对话系统将在技术上为用户使用不同类型的问题使用不同的框架。以下是几种不同类型的对话机器人。
对话机器人创建平台
如果您只想在自己的产品上应用具有更简单功能(BOT)的对话机器人,则bot 平台是最佳选择。机器人创建平台可以帮助没有人工智能技术的用户和企业快速创建对话机器人。国外更典型的机器人创建平台包括wit.ai和(以前为api.ai)。中国也有许多企业家团队这样做。诸如AI,,Ruyi等之类的东西
搜索单轮对话机器人
搜索单轮机器人(FQA机器人)的技术和信息检索参与是相似的,如 2所示。
图2 FAQ机器人流程图
由于妇科和重述答案包含很少的单词,因此将扩大和重写妇科和候选答案的妇科和重述。单词表示工具等可以获取每个单词的向量表示,然后使用这些单词向量来计算每对单词之间的相似性以获得同义词候选人集。当然,也可以通过现有的结构化知识源(例如等)获得同义词。可以使用一些半监督的方法(例如污垢或双语语料库)在单语语料库上构建重述。 PPDB网站包含许多由双语语料库构建的重述数据集。
知识图机器人
知识图机器人(KG-Bot,也称为问答系统)使用知识图来推理和回答一些基于事实的问题。知识图通常表示知识为三胞胎 - (主题,关系,对象),其中关系代表主体与对象之间存在的某种关系。
构建通用知识图非常困难,不建议从0开始构建。我们可以直接使用一些公开可用的通用知识图,例如Yago,CN-等。请在特定领域构建知识图,请请参阅“知识图技术介绍”(),“最完整的知识摘要#1:概念和构造技术”()()()和其他文章等文章。知识图可以使用图形数据库(例如等等)存储。当然,如果数据量很小,它也是一个不错的选择。
为了将用户映射到知识图的三倍,实体链接(与知识图中的实体相应的实体),关系提取(包括关系的识别)和知识推理(可能包含多个)代替单个关系,它对应对于知识图中的路径,推理是找到此路径)和其他技术。
任务型多轮对话机器人
通过多次对话和与用户的交互,任务机器人可以帮助用户完成特定的任务。流程图如图3所示。
图3任务机器人流程图
除了语音交互的ASR和TTS部分外,它还包含以下过程:
聊天机器人
在实际应用程序中,聊天元素将不可避免地参与用户与系统互动的过程。聊天功能可以使对话机器人更加情感和温暖。聊天机器人(-bot)通常在机器翻译中使用深度学习框架来生成答复,如图4所示。
图4-机器人的模型框架
与机器翻译不同,对话中用户提供的信息通常不足以产生合理的答复,并且对话的历史背景信息也很重要。例如,在图4中:“我今天心情很糟糕!”由于几天前旅行时背部和背部疼痛的酸痛,用户可能心情不好。回答“出去玩乐”是不合理的。研究发现,标准 +模型也容易产生安全且无用的答复,例如“我不知道”和“确定”。
为了使回应产生更多样化和信息性,许多学者进行了许多探索。 Li等人的论文“深入”表明,应考虑诸如引入新信息之类的因素,以确保语义连贯性和其他因素。 V.等人的论文“端到端”不仅在生成答复时使用用户的当前信息,而且还使用层次RNN来添加上一个对话的背景信息。 Jun Yin等人的论文“”在生成答复时融合了外部知识库信息。
提出了上面的各种机器人来解决某些特定问题。我们还分别介绍了每个机器人的主要组件。但是这些组件中有许多都存在于各种机器人中。例如,知识图还用于搜索,任务和聊天机器人。
实际应用程序通常包含多种不同类型的机器人,它们可以一起回答用户的不同类型的问题。我们将协调不同机器人的机器人称为路由机器人(-bot)。路由机器人决定哪些机器人将问题发送给哪些机器人,以及哪些机器人最终根据历史上下文和当前情况使用向用户提供的答复。图5是框架图。
图5-机器人框架对话机器人的当前状态
对话机器人的历史悠久,自1966年麻省理工学院心理治疗师机器人以来已经过去了半个世纪。但是现代意义上的机器人实际上很年轻。由于搜索引擎的商业成功和信息检索的快速开发,从技术取回的单轮对话机器人现在相对成熟。最近,学术和工业界还积极探索了在检索机器人中使用深度学习技术(例如CNN和RNN)的使用,从而进一步提高了系统的准确性。尽管技术在技术方面相对成熟,但在实际应用中检索机器人还有许多其他问题。例如,许多公司在历史上积累了大量的非结构化数据,但是这些数据不能直接输入检索机器人,但需要提前手动整理。即使某些公司有一些数据可以直接输入具有正确答案的检索机器人,但这个数字通常只有几十至数百人,这很小。可用数据的质量和数量限制了检索机器人的准确性及其在行业中的广泛使用。
与搜索机器人相比,知识图机器人年轻。大多数知识图机器人只能回答简单推理的事实问题。原因之一是,很难以高精度和广泛的覆盖范围构建知识图,并且需要大量的人力来处理数据。引入深度学习模型,例如绕过或解决这个困难吗?
任务类型的多轮对话机器人只有十多年的开发历史,现在可以更确定地解决多轮任务。但是,当前基于任务的机器人通常可以工作的情况通常太理想了,在大多数情况下,用户所说的话不能准确地表达为ACT斜线 - ,因此随后基于此基础构建的后续过程变得非常脆弱。许多学者提出了各种端到端研究计划,以试图改善基于任务的机器人的鲁棒性。但是,这些解决方案基本上需要使用大量的历史对话数据进行培训,并且在实际和复杂的情况下尚未验证效果。
开放式域聊天机器人目前是学术界的宠儿,也许是因为有太多的事情要改进。纯生成模型在相对确定的应用程序中具有良好的效果,并且可以应用于生产环境;但是,当回复格式非常灵活时,可能无法保证其生成的答复的连接性,更不用说结果了。理性。生成模型的另一个问题是,其生成结果较低,效果优化也不容易。但是,该领域的学术进步非常快,许多学者已经在探索使用新算法框架(例如深度增强学习和gan)的使用。
尽管对话机器人目前可以解决的问题非常有限,但不可能替换人们在短期内完成更复杂的任务。但这并不意味着我们不能在发电机环境中使用对话机器人。寻找合适的用法方案,对话机器人仍然可以大大提高业务效率。到目前为止,AIN 已成功地将对话机器人应用于 ,和 等销售转换方案,并还验证了对话机器人在对话发现中的作用和电子商务产品的建议。
如果对话机器人可以与真实的人平稳沟通,并且没有被真实的人发现作为机器人,那么机器人已经通过了图灵测试。当然,当前的对话机器人技术远非该目标,但是我们正在逐步实现这一目标。随着语音识别和NLP等技术的持续发展,随着物联网时代的出现,对话机器人的阶段将变得越来越大。
作者资料:
Wu 于2017年初加入Ain 担任合作伙伴,并负责算法部门的工作。他有博士学位来自北京大学。毕业后,他加入了阿里巴巴云和贾亚恩。作为的高级总监,他负责数据和与AI相关的工作,并开发了中国对话机器人创建平台“ AI”。
编辑:he ()
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;
工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态