庄闲和游戏
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 在设计网站中颜色和特效的作用

    2026-06-27 12:05

    网站开发设计对视差特效的应用方式有很多种,其中对于视觉特效方面,最有趣的应用方式之一,是让色彩和不同的内容结合到一起,用来展示不同的项目和元素。颜色的变化和动画组合到一起,用交互来触发,产生

  • 中远物流联手庄闲和游戏共建无界电商平台

    2026-06-24 06:54

    中远海运物流是居中国市场地位的物流企业,在项目物流、工程物流、综合货运、仓储物流、船舶代理、供应链管理、理货检验等业务领域为国内外客户提供全程物流解决方案。中远海运物流在中国境内30个省、市

  • 庄闲和游戏带您了解网站开发对企业的五大优势

    2026-06-14 18:18

    如果你想建立一个网站,你也应该知道网站开发的优势可以体现在哪里。下面庄闲和游戏列举了网站开发对企业发展的一些主要优势。1.有更多的广告机会如果你在当地报纸上做过广告,你就会知道这些费用。

  • 金秋9月 哪些网页设计趋势正在流行

    2026-06-05 08:00

    网页设计趋势总会在你感觉迷茫的时候,给你带来一点点的灵感,让你的网页设计变得更加出众。虽然我们经常说网页设计不要“跟风”,否则网站会失去个性,但有时候借助网页流行趋势,却能帮你设计出更合时宜

  • 三问大数据:好用吗?畅通吗?安全吗?

    2026-06-04 17:35

    从移动支付到共享经济,大数据正在加速重塑着大众生活的诸多方面;从万物互联到智慧城市,大数据正在深刻影响着经济发展、社会治理、管理的各个领域。了解大数据、掌握大数据、运用大数据,这是当下的现实

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-06-23 20:09
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。