?

美媒:人工智能实现“闻声识人” 但远未达到完美

2019-06-13 14:06:25 参考消息网

参考消息网6月13日报道 美媒称,人工智能(AI)现在可以做到只参考一小段音频,就能生成一个人面部的数字图像。

据美国趣味科学网站6月11日报道,科学家用网上数百万段教学视频,对这种名为“讲话到面孔”的神经网络——以类似人脑方式“思考”的计算机——进行了训练,视频内容是10万多个不同面孔讲话的场景。

研究人员在一项新的研究结果?#34892;?#36947;,通过这些数据集,“讲话到面孔?#38381;?#25569;了声音信息与人脸某些特征之间存在的关联。然后,人工智能会利用一段音?#36947;?#22609;造与语音匹配的拟真面孔。

这一研究结果5月23日发表在阿奇夫论?#33041;?#21360;本网站上,尚未接受同行评议。

报道称,值得庆幸的是,人工智能(尚)不能仅凭一个人的声音就知道他到底长什么样。研究报告的撰写者说,该神经网络会识别讲话中指向?#21592;稹?#24180;龄和种族的一些标记,这些特征是许多人共有的。

科学家在研究报告?#34892;?#36947;:“如此一来,该模型只会形成普通长相的面孔。它不会形成特定个人的形象。”

人工智能已经证明,它可以生成准确度高得惊人的人脸,不过坦?#23454;?#35762;,它所塑造的猫脸有点恐怖。

报道称,“讲话到面孔”生成的人?#22330;?#37117;是面朝前方,没什么表情——与声音背后的人并不严格匹配。不过研究结果表明,它生成的形象确实经常捕捉到了讲话者正确的年龄段、种族和?#21592;稹?/p>

然而,这种算法对声音信息的解读还远未达到完美。在面对不同的语言时,“讲话到面孔”表现得?#27809;?#21442;半。例如,人工智能在听了一段亚洲人讲中文的音频后,相关程序形成了一个亚洲人的面孔。然而,据科学家说,当同一个人在另一段音频中用英语说话时,人工智能生成了一个白人的面孔。

该算法还显示出?#21592;?#19978;的偏见,将?#32479;?#30340;声音与?#34892;?#38754;孔联系起来,将尖细的嗓音与女性面孔联系起来。研究人员在报告?#34892;?#36947;,由于?#32654;?#35757;练人工智能的数据集只是YouTube网站上的教学视频,因此“不能代表全世界的人口”。

?
(function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();
玉皇大帝闯关
河南快3预测与推荐 时时彩计划 重庆时时个计划软件 时时彩后1稳赚万能 贵州茅台股票分析2018 湖南快乐10分走势 轩彩娱乐app下载 贵州快三开奖结果查询 24码特围开特 拼多多两块多的商家怎么赚钱 麻将娱乐棋牌 湖北快三一码遗漏 时时彩骗局 玩呗斗牌手游赚钱吗 黑马计划软件官网 91千炮捕鱼棋牌游戏