揭秘Siri，苹果发布论文阐释语音助手设计想法

来源：智能网

时间：2020-02-06 20:02:28

热度：74

揭秘Siri，苹果发布论文阐释语音助手设计想法就多任务处理、多语言识别等问题，苹果在论文中给出了自己不同的想法。最近，苹果发布了一系列论文来阐释语音助手的重要工作机理，公开揭秘Si

就多任务处理、多语言识别等问题，苹果在论文中给出了自己不同的想法。

最近，苹果发布了一系列论文来阐释语音助手的重要工作机理，公开揭秘Siri，向业界贡献了自己在设计上的不同想法。

揭秘Siri，苹果发布论文阐释语音助手设计想法

在第一篇论文中，苹果就语音助手中的多任务处理问题进行了阐释，它指出在Siri中，唤醒处理通常需要两个步骤：AI首先必须确定输入音频中的语音内容是否与触发短语的语音内容匹配（语音触发检测），然后必须确定说话者的语音是否与一个或多个注册用户的语音相匹配（说话者验证）。一般方法是将两项任务分别来处理，苹果则认为可以用一个神经网络模型同时解决两项任务，同时它表示，经过验证，该方法各方面性能可以达到预期。

揭秘Siri，苹果发布论文阐释语音助手设计想法

在该论文中，研究人员给出了模型示例。他们在包含16000小时带注释样本的数据集中训练了基于两种思路下设计的模型，其中5000小时的音频带有语音标签，其余均只有扬声器标签。相比于一般训练模型去获取多个标签的思路，苹果通过将不同任务的训练数据进行级联来训练多个相关任务的模型。结果发现，在性能表现相同的情况下，苹果新提出的模型反而更适合应用，它能够在两个任务之间共享计算，大大节省了设备上的内存空间，同时计算时间或等待时间以及所消耗的电量／电池数量都将降低。

在另一篇论文中，苹果还介绍了多语言演讲场景的演讲者识别系统设计——知识图谱辅助听写系统决策。以声学子模型为例，它可以基于语音信号传输痕迹来进行预测，并且其上下文感知的预测组件考虑了各种交互上下文信号，其中上下文信号包含有关发出命令的条件信息、已安装的命令语言环境、当前选择的命令语言环境以及用户在发出请求之前是否切换命令语言环境的信息。

结果显示，这一设计的优势在于，它们可以在语音信号太短而无法通过声学模型产生可靠预测的情况下提供帮助。

此外，苹果还提出了一项补充研究，缓解错误触发问题，即忽略不适合语音助手（Siri）的语音。基于图结构设计AI模型的思路，研究人员提出了一种图神经网络（GNN），其中每个节点都与标签相连。结果显示，该模型减少了87％的错误触发。

作者：Lynn

热门标签：语音苹果模型

免责声明：此资讯系转载自互联网其它网站，全球新能源网登载此文出于传递更多信息之目的，并不代表本网赞同其观点和对其真实性负责，文章内容仅供参考。如涉及作品内容、版权等问题，请在30工作日内与本网联系，我们将在第一时间处理！

上一篇：工业企业利润信息发布：汽车工业利润同比下降15%

下一篇：华为起诉Verizon，涉嫌侵权12项专利

欲将手势控制引入到头戴？苹果又要给我们带来惊喜

2020-02-06
摒弃传统！苹果全新触摸手势控制耳机专利曝光

2020-02-06
欧盟统一充电口，苹果Lightning接口要凉凉？

2020-02-05
苹果全新耳机专利曝光，可自动监测耳朵位置，调整触控板

2020-02-05
苹果下调出货量：疫情导致

2020-02-03
苹果iMac新设计专利：一整块“J”形曲面玻璃

2020-01-31
iPhone销量回暖实现逆增长，苹果再唱高歌？

2020-01-30
库克透露，苹果正在研发疾病预防技术

2020-01-24
捂住钱包，2020年这些苹果产品必buy！

2020-01-22
拒绝抢跑5G的苹果，究竟在等什么？

2020-01-21
台积电5nm工艺量产进展顺利苹果华为需求量最大

2020-01-20
无法阻止！苹果AirPods Pro降噪隔离效果变得越来越差

2020-01-20
郑州全新智能公交车开始运营：具有无人驾驶和语音控制功能

2020-01-20
陈伟：AI语音市场要靠3.0技术撬动

2020-01-18
小米穿戴正式登陆苹果App Store

2020-01-17