当前位置: 网站首页 > 18luck新利app

亚历山大2019年要去哪里?

2019-05-20来源:18新利luckcom

    原名:Alexa 2019年要去哪里?在2018年,亚马逊Alexa语音助手在

    原名:Alexa 2019年要去哪里?

    在2018年,亚马逊的Alexa语音助理从广度上而非深度上取得了进步。记住,当亚马逊在2014年秋季推出第一款AI音频回声时,很多人不知道回声是如何工作的。从2014年到2018年,Echo和Alexa驱动的智能设备逐渐淡出了神秘的面纱,在人们的日常生活中无处不在。

    亚马逊的语音助理Alexa可以访问的国家数量已经翻了一倍多,并产生了大规模的增长。对于初学者,Alexa可以用来学习法语和西班牙语。在这个阶段,超过28000个智能设备正在与Alexa合作,这是今年年初合作设备数量的六倍。Alexa内置超过100种不同的产品和设备。还记得比利·巴斯《大嘴巴比利·巴斯》吗?今年,这种可以转动头部、摇尾巴、张嘴唱歌的鱼与Alexa很相配。

    亚历山大2018年的发展道路一直影响和界定着2019年及以后的发展趋势。Alexa正在进行一些公众可能根本没有注意到或注意到的安静而微妙的变化。

    技术与变革

    在过去的一年里,亚历克斯发展了很多新的技能。例如,Alexa可以根据上下文从一个查询移动到下一个查询,激活后续问题而不需要重复唤醒单词。用户可以根据需要请求Alexa在同一请求中执行多个操作,从而在不知道确切名称的情况下调用Alexa应用程序中的技能。

    这些细微的调整是看不见的,但在积累之后,数量变化导致质量变化。用户和机器之间的通信比一年前变得更加柔和顺畅,更加自然。亚马逊继续引进和改进机器学习技术。在人类语言专家的帮助下,系统识别中的主动学习功能大大降低了错误率。

    亚马逊Alexa公司的副总裁兼首席科学家罗希特·普拉萨德(Rohit Prasad)说,主动学习已经融入亚马逊的每个渠道,包括语音识别和自然语言理解。这些使得亚马逊的机器学习模型更加完整。”

    近年来,数据表示已经成为一个重要的研究课题。自然语言理解(NLU)系统很少输入原始文本,而是使用嵌入的形式。数据表示保存了文本的语义信息,而不是以连续和确定性的方式呈现。利用嵌入式技术改进特殊的NLU任务已经被多次使用。

    在今年的IEEE语言技术峰会上,亚马逊专门为Alexa NLU提供了一个数据表示解决方案。数据表明,该方案在一些关键任务和几千项技能中降低了40%的技能选择错误率。在Alexa的NLU系统中,用户语言被分类得更加精细。

    首先,会话字段或会话话题的类别,如音乐和天气。其次,根据用户的潜在意图或期望的会话对其进行分类。例如,在音乐领域,可以是诸如搜索、播放、下载等命令。最后,根据单词的位置类型对单词进行分类。例如,播放AA唱的XX首歌,AA属于歌手的名字,XX属于歌曲的名字。

    亚马逊的数据表示方案通过域、意图和位置三个方面形成了一个自然的层次结构。通过一系列语言位置,用户意图通过串联语言来定义,并且一系列意图构成域。亚马逊已经培训了覆盖17个领域的246000个语言神经网络。网络首先生成一个位置表示,然后是意图表示,最后是域表示。

    在训练过程中,神经网络需要评估如何准确地对领域进行分类,目的是表达而不是分类。评估有效地执行了表示的层次结构,这确保了语言的位置和意图不会丢失域所需的任何信息。当进入一个网络时,它首先通过一个“去词汇器”,它用一个特定的语言位置值代替它,例如,播放Drakes ice for.,进入播放歌手的歌曲。这个过程由一个单独的NLU系统处理。网络分类的目的在于分类最好的表示方式,而不是分类。

    雷锋笔记:架构图,如何生成意图,聚合意图,生成领域表示

    去词汇化句子被传递到嵌入层,使用现有的嵌入网络。网络将单词转换成固定长度的向量数字字符串。例如,在高纬度的空间坐标中,具有相似含义的单词被聚类在一起。特定的单词通过去词化器由简单的标准嵌入,但是对语言位置的理解是不同的。网络以培训为代表。该算法梳理训练数据以识别每个语言位置的可能值。例如,与天气领域中的天气条件相关的语言位置可以包括风暴、暴雨、雪、暴风雪等。

    具有相似词义的嵌入词在空间位置上相互接近,并且具有平均嵌入层的多个相关词可以捕获其空间位置的邻近性。在训练之前,去词汇化的位置被简单地嵌入为平均可能值。在训练过程中,嵌入式网络设置可以根据语言位置、意图和领域特征进行修改和调整。基本原理仍然是对向量进行分组。

    去词汇化语篇被嵌入并传输到长期和短期的双向记忆网络。LSTM顺序地处理数据,并在先前的输出中处理给定的输出因子。LSTM在NLU中得到了广泛的应用,因为它可以学习根据单词在句子中的位置来解释单词。融合LSTM(bi-LSTM)是一种LSTM,它处理从前到后和从后到前相同的输入序列。

    双LSTM的输出是用于表示意图的向量。意图向量通过单个网络层,生成域表示。为了评估演示方案,Amazon将代码输入到两个技术选择系统中。以原文为输入,系统的准确率为90%,亚马逊的准确率为94%。

    为了证明它的成功依赖于分类类别的分层嵌套,比较了三种不同的分类系统,融合了去词汇化输入学习域和基于LSTM编码的意图嵌入。这三个系统都体现了对原文本的改进,不能与层次系统相匹配。基本上,通过深入学习,亚马逊建立了大量领域的模型,并将学习转移到新的领域或技能。

    最近,亚马逊启动了迁移学习项目,这是亚马逊未来战略的一部分。机器学习改进最直接的影响就是与去年相比将系统错误率降低25%。此外,今年12月,亚马逊推出了机器自学习,允许系统根据上下文线索进行修改。例如,Ro.Prasad说,当用户告诉Echo XM Chill请求失败时,他可以通过Sirius 53继续监听。对于Alexa,XM Chill和天狼星53具有相同和独立的含义。从隐藏的反馈中学习。”

    现状与未来

    “当两个人开始交谈时,很容易感觉到和理解彼此的情绪,但是系统对此无能为力。”人们正在努力发展使系统更加成熟的能力,并理解对话如何以人道的方式发展。卡内基梅隆大学的语音识别专家Alex Rudnicky说。

    今年秋天,亚马逊的一项技术专利表明,Alexa可以识别用户的情绪并做出相应的反应。根据Ro.Prasad的说法,Alexa的最终目标是远程会话功能,根据需要以不同的方式回答给定的问题。当然,要成为一名能理解语音和语调的微妙差异的语音助理还有很长的路要走。亚历克斯·鲁德尼基认为,在人类的五种情绪中,愤怒是最容易识别成功的。

    在这个阶段,亚马逊拥有70000个稳定版本的技能,从测试、游戏到冥想,是两年前的7倍。随着Alexa的设备增加,它的技能也在不断提高。Alexa可以很好地预测人们的意图,但是更多的Alexa用户不理解它的潜在用途,厨房、警报成为最常用的场景。另一方面,开发人员没有更多的精力和动力来为用户研究更多的潜在应用场景。

    事实上,语音助理除了有直接使用需求外,还有很多潜力。更多的人使用Alexa收听NPR并查看天气。Alexa在2016年推出了交互式幻想游戏,并且该算法显然很难提醒用户Alexa的其他潜在功能。

    “如果我们向用户介绍新的技能和功能,这些技能和功能与他们正在做的事情高度相关,那么结果将是好的。”值得注意的是,这些建议需要适当的时机和内容。否则,将导致信息过载。托尼·里德说。根据Canalys的数据,Q3Echo在2018年发货630万台,紧随其后的是Google 590台。虽然谷歌起步较晚,但它已经成为亚马逊无法忽视的竞争对手。

    在市场容量方面,除了第三方设备,Alexa在用户数量和用户基础方面占据主导地位。但谷歌的优势仍然显而易见。Canalys的分析师Vincent Thielke说,Google已经积累了人工智能很多年了,Alexa正在从头开始。谷歌绝对领先于人工智能,所以很容易赶上亚马逊。

    Android、Android Auto和WearOS可以为Google的助手提供更多的土壤。亚马逊在2014年推出了Fire Phone,但严重失败,因此亚马逊对移动端口的选择非常有限。汽车行业的良好表现不能弥补其在原有项目整合方面落后于谷歌和苹果的劣势。

    诚然,亚马逊Alexa的增长趋势没有放缓的迹象。亚历克斯,她的强项和弱点同样明显,她知道将来要去哪里。只有Alexa知道答案。

    通过亚马逊;有线