您当前位置:首页 > 资讯

人工智能声呐眼镜可识别唇语

来源:
4小时前

       美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。

 

  这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。

  EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。

  研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。

  此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。

  今年以来,人工智能再次引发极大关注。几年前,专家们还在探讨如何让人工智能更加准确地理解人的意图,并与人进行多轮对话。曾经,让人工智能读懂唇语,还只是科幻电影中的桥段。如今,这些都在快速变为现实。面对人工智能带来的超乎预期的变化,不能停留在“看热闹”阶段,人们需要真正去思考,如何更好地主宰人工智能,利用它为人类造福,并尽量规避它可能带来的麻烦。

相关阅读

颜色鲜明的品牌logo、随风招展的品牌道旗、重点产品大幅海报……在酒店内外,五粮液元素随处可见,成为一道靓丽的风景。作为浓香型白酒典范和中国白酒[详细]

2023-04-10 16:40:14

美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发[详细]

2023-04-10 13:32:47

4月3日,德国联邦数据保护专员乌尔里希·凯尔伯称,出于对数据安全保护的考量,德国可能会效仿意大利,暂时禁用ChatGPT。他透露,禁用该软件的行为将属于德国[详细]

2023-04-10 13:12:02

3D打印工艺是指由机器自主“打印”连续的一层层软性、液体或粉末状材料,这些材料会迅速硬化或融合,从而形成三维固态物体。自20世纪80年代问世以来,3D打[详细]

2023-04-10 11:54:44

2018年4月,中国宣布支持海南全岛建设自由贸易试验区,支持海南逐步探索、稳步推进中国特色自由贸易港建设。海南全面深化改革开放大幕由此拉开。五年来,海南自贸港[详细]

2023-04-10 11:50:41

近日,苹果应用商店里及OPPO应用商店内出现了数款以“文心一言”或“文心xx”命名的App。百度4月7日通过百度AI微信公众号发表声明指出,目前文[详细]

2023-04-10 11:49:02

拍照打卡看似是一个非常私人化的行为,但在一个需要讲究规则的时代,并非可以完全随心所欲  “明天拍不了了,我们年卡的都不让进了,手机也不让拍了。&rdquo[详细]

2023-04-10 11:24:42

“你们这餐巾纸怎么收费这么贵呀?”近日,从山西来乌鲁木齐游玩的朱先生在某连锁餐馆用餐,结账时发现多了一笔5元的餐巾纸费用,他表示不解,“提供[详细]

2023-04-10 11:22:55

  • 意见反馈:g2416238474@163.com
  • 稿件投诉:g2416238474@163.com
  • 网站首页:www.udlsy.com
  • 客服联系:g2416238474@163.com
  • 关注我们