💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
本文档是集成科大讯飞MSC(Mobile Speech Client,移动语音终端)Android版SDK的用户指南,介绍了语音听写、语音识别、语音合成、语义理解、语音评测等类和函数的基本使用。关于各类的函数和参数更详细的说明,请参考 [**MSC Android API 文档**](http://mscdoc.xfyun.cn/android/api);在集成过程有疑问,可登录语音云开发者论坛,查找答案或与其他开发者交流:http://bbs.xfyun.cn 。下载SDK请前往 [讯飞开放平台](http://www.xfyun.cn)。 安卓 MSC SDK 的功能从调用开始到结果返回,大多使用接口(Interface)回调(Callback)的方式返回结果和状态。更多关于接口和回调的介绍,可以参考 Java 语言的相关语法说明文档。 **注意**: * 此文章的代码,仅为用于示例函数调用和参数设置的代码片段,很可能有参数被引用,却未曾声明等情况,请开发者不必过于考究其中的细节。更详细的示例,请参考 SDK 包中的 samples 目录下的示例工程。示例代码中返回的结果内容,可参考附录。 * 为了减少SDK包在应用中占用的大小,官网在下载单个功能的SDK包时,libmsc.so 可能并不包含其他功能,如下载人脸的SDK包时,可能不包含离线唤醒或离线合成等功能(在应用使用不包含的功能时,会出现崩溃或报20021的错误)。应该下载对应功能的SDK包使用,或下载组合的SDK包。 示例代码中返回的结果内容,可参考[附录](附录.md)。 MSC SDK 的主要功能接口如下图所示: ![](https://box.kancloud.cn/6ef7461b477377ebb00a80d6803ed8d5_815x628.jpg) | 名词 |解释 | |:---: | --- | | 语音合成 |将一段文字转换为成语音,可根据需要合成出不同音色、语速和语调的声音,让机器像人一样开口说话。 | |语音听写|将一段语音转换成文本,把语音中包含文字信息提取出来,并可以优先识别用户手机特有的联系人和个性化数据。| |语法识别|判断用户所说的内容是否与预定义的语法相符合,主要用于识别用户是否下达某项指令,使用语法识别前,需要先定义语法。| |语义理解|在语音听写基础上,分析理解用户的说话意图,返回结构化的指令信息。开发者可在语义开放平台定义专属的问答格式。| |唤醒|通过说出特定的唤醒词(如“芝麻开门”)来唤醒处于休眠状态下的终端设备。| |唤醒+<br>识别|在唤醒的同时对用户所说的内容进行语法识别。| |语音评测|通过智能语音技术自动对发音水平进行评价,给出用户综合得分和发音信息。| |声纹密码 | 根据语音波形反映说话人生理和行为特征的语音参数,自动识别说话人身份,声纹识别所提供的安全性可与其他生物识别技术(指纹、掌形和虹膜)相媲美。| |人脸识别 |基于人的脸部特征信息进行身份识别的一种生物识别技术,可以自动在图像中检测和跟踪人脸,进而对检测到的人脸进行检测和验证。系统同时支持人脸关键点检出、视频流人脸检测等功能,识别率高达99%。 | |身份验证 |应用可根据应用场景灵活的选择身份验证方式,如单人脸验证、单声纹验证以及人脸+声纹的融合验证方式。这样既解决了单生物特征识别暴露的局限性,也提供了更精准、更安全的识别和检测方案。身份验证方案还会持续增加更多的常用特征,达到更广泛的市场应用前景。 |