北京梦雨楼论坛,一品阁茶楼,深圳私人喝茶工作室,北京一品楼凤qm论坛

语音识别测试

语音识别(ASR)评估指标

在测试语音识别的过程中,衡量识别内容的准确性,一般通过如下指标进行评估

WER(WordErrorRate,词错率)

定义:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER

WER=(S+D+I)/N

S:substitution,替换

D:Deletion,删除

I:Insertion,插入

N:标准词序列中词的总个数

(S+D+I)=识别出来的词序列与标准的词序列之间的编辑距离

注意:因为有插入词(Insertion),所以可能会出现WER>1的情况,不过,WER>1时,表明识别出来的词序列和标准的词序列相差很大,识别效果特别差

SER(SentenceErrorRate,句错率)

定义:句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的个数,除以总的句子个数即为SER

SER=SE/N

SE:识别出来的序列中,识别错误的句子个数(即WER!=0的句子个数)

N:标准序列中总句子个数

(2)、验证识别内容的准确性

统计识别文字的WER、SER指标

(3)、关注语音识别耗时

①短语音的识别耗时

②长语音的识别耗时


更多详情可联系蓝亚技术工作人员:Benson

手机/Mob:(+86)13632500972

邮箱/E-mail:marketing@cblueasia.com

服务范围

<script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?6844225bf949cff65b89ec7139b9ad0f"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script>
主站蜘蛛池模板: 中卫市| 吴桥县| 宜章县| 榆中县| 微山县| 东源县| 彰化市| 鹤峰县| 大荔县| 关岭| 盘锦市| 漳州市| 台北市| 东安县| 襄樊市| 甘孜县| 炉霍县| 临湘市| 神农架林区| 栾川县| 京山县| 建瓯市| 平顺县| 深水埗区| 辽阳市| 金塔县| 平谷区| 临漳县| 星座| 汾西县| 顺平县| 永昌县| 北辰区| 布尔津县| 色达县| 汝阳县| 宽城| 博湖县| 兴义市| 鄄城县| 徐州市|