Welcome to the website navigation,本站只接受合法正规的企业网站,欢迎站长们提交你的网站获得展示和流量有任何问题请联系站长,欢迎大家加入本站。

                
提交网站
  • 网站:76083
  • 待审:5
  • APP:577
  • 文章:304411
  • 会员:56004
文字内链包年1000元 文字内链包年1000元 文字内链包年1000元 AI办公网站 AI绘画工具 AIchat

  【CNMO新闻】近期,语音识别技术发展迅猛,像EdgeSpeechNet等最先进的模型能够达到97%的准确率,但即使是最好的系统偶尔也会被生僻字难倒。UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

  为了解决这个问题,谷歌和加利福尼亚大学的科学家提出了一种方法,可以利用纯文本数据训练拼写校正模型。在预印本服务器Arxiv.org上发表的一篇论文《用于端到端语音识别的拼写校正模型》中,他们表示,在使用800字、960小时语言建模LibriSpeech数据集的实验中,他们的技术显示,相对于基准,单词错误率(WER)改善了18.6%。在某些情况下,它甚至可以减少29%的错误。UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

  他们写道:“目标是将一个接受了文本数据培训的模块纳入端到端框架,纠正系统所犯的错误,具体来说,我们的调查使用了不成对的数据,利用文本到语音(TTS)系统生成音频信号,这个过程类似于机器翻译中的反向翻译。”UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

  正如论文作者所解释的那样,大多数自动语音识别(ASR)系统要训练三个组成部分:一个学习音频信号与构成语音的语言单位之间关系的声学模型,一个为单词序列分配概率的语言模型,以及一种用于对声学帧和识别的符号进行匹配的机制。所有这三者都使用一个神经网络和转录的音频-文本对,因此,当语言模型遇到语料库中不经常出现的单词时,通常会出现性能下降。UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

  然后,研究人员开始将上述拼写校正模型纳入ASR框架,一种将输入和输出句子解码为“词组”的子词单元的模型,他们使用纯文本数据,并利用文本到语音(TTS)系统生成的音频信号来训练LAS语音识别器,这是2017年Google Brain研究人员首次描述的端到端模型,然后创建一组TTS对,最后,由他们来“教导”拼写纠正器纠正识别器的错误。UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

  为了验证这个模型,研究人员训练了一个语言模型,生成一个TTS数据集来训练LAS模型,并产生了错误假设以训练拼写校正模型,其中包含了来自LibriSpeech数据集的4000万个文本序列。他们发现,通过纠正来自LAS的条目,语音校正模型生成的扩展输出的错误率“显著”降低了。UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

UfnAIChat_企业网址导航_网址分类目录_企业黄页网址提交查询专业网站!

分享到:

  admin

注册时间:

网站:0 个   APP:3 个  文章:0 篇

  • 76083

    网站

  • 577

    APP

  • 304411

    文章

  • 56004

    会员

赶快注册账号,推广您的网站吧!
文章分类
热门网站
最新入驻APP小程序

宝贝市场2023-02-08

宝贝市场——买手和卖家商品展示

夺宝助手2023-02-08

夺宝助手小程序,查看每日快夺宝平

查诚信2023-02-08

查诚信是一款免费的商业查询工具

车价天天报2023-02-08

快速连接汽车销售,获知汽车最新报

考勤助理小程序2023-02-08

上班签到考勤,实时定位,后台轻松

汽车报价大全查询2023-02-08

汽车报价大全查询提供最新汽车市