百度云语音识别接口/sdk都有哪些用途?
2020-04-02
百度语音识别是采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。百度云语音识别接口/sdk都有哪些用途?
百度云语音识别接口/sdk都有哪些用途:
一、短语音识别标准版
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
二、 短语音识别极速版
将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景。
三、 实时语音识别
基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。
四、远场语音识别
通过麦克风阵列前端处理算法,即使在三至五米的距离说话也可准确识别。
五、呼叫中心实时语音识别
采用针对呼叫中心电话场景专有语音识别模型,实时精准的将电话语音识别为文字,适用于智能语音IVR、实时客服辅助、智能外呼等场景。
六、呼叫中心音频文件转写
基于呼叫中心专属模型,可大批量低成本的将8k采样率电话录音文件识别为文本。适用于电话内容分析、质检场景。
七、 语音自训练平台
使用业务场景文本语料,零代码自助训练语言模型,精准识别语音内容,有效提升业务领域识别准确率。