当前位置: 智能网 > 智能家居 > 通过门铃也能识别出是谁在敲门了吗？

通过门铃也能识别出是谁在敲门了吗？

发布日期：2021-03-13 22:02:37 浏览次数：92

这样就完成了大部分的识别任务。语音合成我想知道谁在门口。一开始，我以为在铃声设备上播放声音是最佳策略，但亚马逊不允许我这么做，只允许我播放铃声伴随的默认声音。因此，从文本到语音似乎是一种更合适的方式。这可以通过两个包GTTS和playsound来简化。GTTS使用谷歌的Tacotron 2模型。虽然完全理解它的工作原理并不重要，但对于感兴趣的读者来说，该图说明了它的架构

Tacotron与Seq2Seq非常相似，但是它使用了双向LSTM、卷积层、预网络层，以及最重要的2D生成输入到解码器（光谱图）。如果你想了解更多关于Tacotron 2的内容，这里有一个由CodeEmporium制作的关于这个主题的视频。https：／／www．youtube．com／watch？v＝le1LH4nPfmE＆ab＿channel＝CodeEmporium虽然Tacotron 2算不上是最好的，尤其是与transformer 模型相比，但它确实做到了。使用GTTS python API的方法如下：from gtts import gTTS
from playsound import playsound
language ＝＇en＇
slow＿audio＿speed ＝ False
filename ＝＇tts＿file．mp3＇
def text＿to＿speech（text）：
audio＿created ＝ gTTS（text＝text， lang＝language，
slow＝slow＿audio＿speed）
audio＿created．save（filename）
playsound（filename）

很简单。我使用playsound而不是os．system的原因是，os．system将默认打开默认的声音播放器应用程序，而playsound不会弹出任何窗口。这就完成了项目的最后一个步骤。总结和Git存储库请在这里查看我的git存储库，以获得完整的代码，并轻松地定制你自己的门铃。https：／／github．com／dude123studios／SmarterRingV2在README．md中查看说明，并解释在你自己的家里使用这个系统的确切步骤。只需要5分钟就可以安装好！亚马逊，把它放进你的下一个门铃里！进一步的探索和问题FaceNet是一个相当过时的模式。在过去的五年里，在transformer模型方面有了重大发现，例如ViT。GPT－3是一个概括之神。完成创建广义嵌入的任务后，GPT－3之类的转换器会更好地工作吗？卷积神经网络可能不是面部识别的最佳选择，因为长期依赖关系（如耳朵或下颚线）需要庞大的网络。另一方面，transformer模型可以考虑到自相似性，并且实时进行人脸识别的速度要快得多。

<上一页 3 4 5

下一篇：中芯国际的14nm良率达90－95％，追平台积电同等工艺！
上一篇：巴赫感谢中国奥委会提供新冠疫苗：体现了真正的奥林匹克精神

[ 智能网搜索 ] [ 打印本文 ] [ 违规举报 ]

• 汽车智能化需求带动智能控制器迅猛增长，中国厂	• 起亚海外大规模召回，召回数量高达近38万辆
• 拜登政府增加对华为供应商新限制，谈判前增加筹	• 工业领域AI视觉检测服务商“心鉴智控”完成A轮
• 兰卫检验创业板首发过会，拥有10家独立医学实验	• 全面赋能宝德人工智能2021大战略解读
• 阿斯利康新冠疫苗疑似引发多起不良反应并造成死	• 燃石医学发布2020年度财务报告：净亏损4.07亿元
• TCL空调新品亮相2021春季发布会，聚焦全新新风	• 联想thinkplus布局智慧医疗，助力解放军总医院
• 云计算基础设施逐渐成熟，中国SaaS已风至云起！	• 彩电行“一片灰蒙”，谁在押注激光电视？
• 战略投资零氪科技，阿里健康在下什么样的棋?	• 广汽埃安喜欢将事情做到极致，不断突破自我极限

扫地机器人哪个牌子好	QLED与OLED电视之争战
家用吸尘器好用么？无	智能家居想引爆市场