结果获取 · 科大讯飞语音评测 FAQ

[TOC] ## 同一个句子，用美式发音读和用英式发音读，哪个得分会高些 >- 引擎支持多发音匹配，会自动匹配发音。如果匹配出是美式发音，就按美式发音进行评分；如果匹配出是英式发音，就按英式发音进行评分。 >- 用户也可以通过试卷标注指定发音，标注方法请参见 [试卷制作](试卷制作.md) 中英文单词自定义发音。 ## XML中的beg_pos和end_pos可以怎么使用 > beg_pos 和 end_pos 标记了对应节点下内容在语音中的边界，单位是帧，每帧10ms，例如一个单词“word“，其 beg_pos = n1，end_pos = n2，那么在语音中，“word”的位置在 n1\*10ms 到 n2*10ms。 ## XML中的dp_message可以怎么使用 >- dp_message标记内容的切分信息，当值为0时，表示正常；值为16，表示漏读，值为32表示增读。 >- 在解析效果的时候，如果遇到dp_message不为 0 的情况，要进行相应的处理。一般情况下，word节点下dp_message值为16的时候，相关的效果信息都会缺失；值为32的时候，会选择得分最高的word节点作为最终结果。 ## 为什么个别单词打分不准，如：打分不高或者不符合预期 >1. 我们的单词音标兼顾了各种发音的可能，如果您的发音恰好是其中一种，但您的预期是不应该打高分时，就会产生误差，建议您自己定义该单词发音，具体使用方法请参见 [试卷制作](试卷制作.md) 中英文单词自定义发音。 >2. 我们的评分标准参考了每个音素的得分情况，对于发音相近的音素或单词，引擎会产生混淆。例如单词“about”和“above”，这样有可能造成打分不准。 >3. 对于极个别人的发音，由于声学模型限制，可能识别不准，所以导致评测也有可能不准。如果，以上解答仍有疑问，可联系我们，提供相关音频数据和试卷内容，我们具体分析后再做答复。 ## 乱说、乱读得高分的问题怎么解决 > 1. 评测结果中会给出 is_rejected 字段，当字段值为 true 时，说明此时是用户乱说导致的拒识，开发者可根据这个字段判断此次用户是否为乱说。 > 2. 在拒识的同时依然会给出得分，因为目前识别乱说的准确率没有100%，所以存在误拒的情况。如果引擎给0分的话，也不合适。 > 3. 引擎可以检测出来用户是乱说的，但无法保证一定是低分。所以说，如果引擎报出乱说，那么就可以认为评分已经不可信。这种情况下，开发者可以给用户显示 0 分，也可以在显示引擎分数的同时，给出乱说的检测结果。这个由开发者自己来决定哪一种方式更合适。 > 4. 还有个属性字段 except_info，如果其属性值为28673（音量小/无语音），28680（信噪比低），28690（有截幅），则说明使用环境存在问题，打分也是不可信的。 ## 结果评分分值与日常经验中的优、良、中、差的对应关系 >其实这两者之间并没有严格的对应关系，以下对应关系仅供参考： |等级 |五分制分值|百分制分值| | :---: | :---: | :---: | |优|4.3分~5分|86分~100分| |良|3.5分~4.2分|70分~85分| |中|2.5分~3.4分|50分~69分| |差|1.5分~2.4分|30分~49分| |很差|0分~1.4分|0分~29分|