企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
富源语音转写针对语音的长时相关性进行语言建模,将音频数据转换成文本数据,为后续的信息处理和数据挖掘提供基础。 具体表现形式为,将多种格式的长段音频文件(暂只支持10M以内)转换成包含时间戳、词属性以及句子标志的文字信息。 ### 转写的是已录制音频(非实时),音频文件上传成功后进入等待队列,待转写成功后用户即可获取结果,返回结果时间受音频时长以及排队任务量的影响。如遇转写耗时比平时延长,大概率表示当前时间段出现转写高峰,即有任务积压排队,属正常现象,请耐心等待。 ### 注: 1. 文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。 2. 词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。 3. 语音转写的识别文字结果为异步获取,最长12小时之内获取。 # # #