企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
[TOC] ## 同一个句子,用美式发音读和用英式发音读,哪个得分会高些 >- 引擎支持多发音匹配,会自动匹配发音。如果匹配出是美式发音,就按美式发音进行评分;如果匹配出是英式发音,就按英式发音进行评分。 >- 用户也可以通过试卷标注指定发音,标注方法请参见 [试卷制作](试卷制作.md) 中英文单词自定义发音。 ## XML中的beg_pos和end_pos可以怎么使用 > beg_pos 和 end_pos 标记了对应节点下内容在语音中的边界,单位是帧,每帧10ms,例如一个单词“word“,其 beg_pos = n1,end_pos = n2,那么在语音中,“word”的位置在 n1\*10ms 到 n2*10ms。 ## XML中的dp_message可以怎么使用 >- dp_message标记内容的切分信息,当值为0时,表示正常;值为16,表示漏读,值为32表示增读。 >- 在解析效果的时候,如果遇到dp_message不为 0 的情况,要进行相应的处理。一般情况下,word节点下dp_message值为16的时候,相关的效果信息都会缺失;值为32的时候,会选择得分最高的word节点作为最终结果。 ## 为什么个别单词打分不准,如:打分不高或者不符合预期 >1. 我们的单词音标兼顾了各种发音的可能,如果您的发音恰好是其中一种,但您的预期是不应该打高分时,就会产生误差,建议您自己定义该单词发音,具体使用方法请参见 [试卷制作](试卷制作.md) 中英文单词自定义发音。 >2. 我们的评分标准参考了每个音素的得分情况,对于发音相近的音素或单词,引擎会产生混淆。例如单词“about”和“above”,这样有可能造成打分不准。 >3. 对于极个别人的发音,由于声学模型限制,可能识别不准,所以导致评测也有可能不准。 如果,以上解答仍有疑问,可联系我们,提供相关音频数据和试卷内容,我们具体分析后再做答复。 ## 乱说、乱读得高分的问题怎么解决 > 1. 评测结果中会给出 is_rejected 字段,当字段值为 true 时,说明此时是用户乱说导致的拒识,开发者可根据这个字段判断此次用户是否为乱说。 > 2. 在拒识的同时依然会给出得分,因为目前识别乱说的准确率没有100%,所以存在误拒的情况。如果引擎给0分的话,也不合适。 > 3. 引擎可以检测出来用户是乱说的,但无法保证一定是低分。所以说,如果引擎报出乱说,那么就可以认为评分已经不可信。这种情况下,开发者可以给用户显示 0 分,也可以在显示引擎分数的同时,给出乱说的检测结果。这个由开发者自己来决定哪一种方式更合适。 > 4. 还有个属性字段 except_info,如果其属性值为28673(音量小/无语音),28680(信噪比低),28690(有截幅),则说明使用环境存在问题,打分也是不可信的。 ## 结果评分分值与日常经验中的优、良、中、差的对应关系 >其实这两者之间并没有严格的对应关系,以下对应关系仅供参考: |等级 |五分制分值|百分制分值| | :---: | :---: | :---: | |优|4.3分~5分|86分~100分| |良|3.5分~4.2分|70分~85分| |中|2.5分~3.4分|50分~69分| |差|1.5分~2.4分|30分~49分| |很差|0分~1.4分|0分~29分|