首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

谷歌DeepMind唇语识别人工智能秒杀专业唇读者

2019-12-19

谷歌的 DeepMind 人工智能公司与牛津大学正在协作一个项目,研制一个具有读唇语功用的人工智能体系。他们从选取了英国 BBC 的近 5000 个小时的电视节目,为这个 AI 体系供给数据库进行读唇语检验,这些电视节目包含《晚间新闻》《BBC 早餐和发问时刻》等,一共包含了 118000 个句子。只需要辨认说话人的嘴唇部位,该体系就能精确地破译整个句子。在破译从数据库中随机挑选的 200 个片段的检验中,AI 唇读体系打败了专业的唇读者。专业唇读者的精确率只要 12.4%,而 AI 体系的精确率为 46.8%。

两周前,牛津大学研制了一个相似的唇读体系 LipNet,但这个体系的数据库 GRID 只含有 51 个单词,而这次与谷歌 DeepMind 协作研制的 AI 体系所选用的数据库含有近 17500 个单词,这是一个很大的前进。并且,GRID 数据库中的句子语法也非常单一,比较简单辨认,但谷歌 DeepMind 的 AI 体系的数据库来自实在的人类句子,语法愈加多样和杂乱。谷歌的 DeepMind 公司和牛津大学称将敞开其数据库资源,这样 LipNet 体系也能够利用它进行实验。



热门文章

随机推荐

推荐文章