• 问题反馈可发送邮件到stubbornhuang@qq.com

  • 欢迎大家交换友链,可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请!

  • 在本站开通年度VIP,无限制下载本站资源和阅读本站文章

  • 感谢大家访问本站,希望本站的内容可以帮助到大家!

  • 计算机图形学与计算几何经典必备书单整理,下载链接可参考:https://www.stubbornhuang.com/1256/

  • 如果觉得本站的内容有帮助,可以考虑打赏博主哦!

  • 本站由于前段时间遭受到大量临时和国外邮箱注册,所以对可注册的邮箱类型进行了限制!

  • 工资「喂饱肚子」,副业「养活灵魂」!

  • 本站会放置Google广告用于维持域名以及网站服务器费用。

语音识别的RTF和RTX评价指标

深度学习 发布于2023-10-30 阅读 4,324次 0次评论 0次点赞 本文共583个字,阅读需要2分钟。

语音识别除了衡量语音识别的准确度之外,另外一个重要的指标就是处理的速度和延迟。其中RTF为衡量实时语音识别处理速度的重要指标,RTX为衡量离线语音识别处理速度的重要指标。

1 RTF

RTF(Real Time Factor),为实时语音识别的处理速度评价指标,其计算公式如下

RTF=\frac{ASR所有音频处理时间(单位秒)}{所有音频总时间(单位秒)}

即给定1秒时长的音频,语音识别需要花多长时间,这个比例小于1才能达到实时识别语音的效果,RTF指标越小越好。

RTF为1表示用户一说完话就能出识别结果(前提是忽略假设录音实时的传给语音识别系统,时间情况很多时候是在服务器端进行解码的,因此会有网络的延迟);RTF大于1就表示话说完了,系统还得再处理一段时间;RTF小于1表示识别速度比说话速度快,这样万一有网络延迟,它还能追上来。

2 RTX

RTX(Real Time X),为离线语音识别处理速度评价指标,其计算公式如下

RTX=\frac{所有音频总时间(单位秒)}{ASR识别所有音频处理时间(单位秒)}

即在1秒时间内,语音识别模型可以处理多长时间的音频,RTX指标越大越好。

参考

欢迎扫码关注我的微信公众号,及时获取文章更新

微信公众号二维码

本文作者:StubbornHuang

版权声明:本文为站长原创文章,如果转载请注明原文链接!

原文标题:语音识别的RTF和RTX评价指标

原文链接:https://www.stubbornhuang.com/2873/

发布于:2023年10月30日 10:57:41

修改于:2023年10月30日 10:58:14

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

文章末尾
上一篇
CSS - 使用Flex实现常用布局
CSS
下一篇
C++ - 深入理解右值与移动语义
C++
当前分类随机文章推荐

发表评论

您必须 [ 登录 ] 才能发表留言!

关注我们的公众号

微信公众号