分享

小探移动设备上的语音识别

最近移动平台上有关语音识别的应用非常火爆,国外有siri和google voice search,国内有像挖财和UC浏览器等推出的语音输入和控制功能。今天也小试了吧,感觉这类技术已到了大规模应用的阶段。
以前的手机上也有类似语音控制的功能,记得最早使用的Nokia 6630就有一个专门语音指令输入的按钮,但这类应用非常简单,只能是有限的指令匹配。而现在,由于云的加入,使得语音识别非常的准确,有让人吃惊的效果,不信的人可以试试挖财上的语音识别。所以现在的语音识别的应用基本上都是在远端的云里完成,移动设备仅仅只是完成语音数据的采集和发送的功能。
于是乎,我就对挖财这类应用是如何做到这么高的识别率产生兴趣,这才发现,它是基于讯飞(http://www.voicecloud.cn)来完成语音识别的,它基于讯飞提供的API,把语音数据发过去,讯飞把识别后的文字返回。既然如此,我们也能基于讯飞做一些有关语音识别的应用的。正好讯飞就是这种提供接口的平台类公司,对开发者的支持还不错,下午花了不到一个小时时间既然可以在手机上搞出一个不错的语音识别应用。
1)申请开发者帐号
http://dev.voicecloud.cn/上申请一个开发者帐号,它会给你一个APP ID,这个审批过程很快,不到10分钟
2)下载SDK
http://dev.voicecloud.cn/download.php?vt=1
我下载的是android SDK
3)编译和调试demo
在下载下来的SDK有个sample目录,下面有个MSCDemo的应用,直接把它导入到eclipse里
编译时有错,把有错那行删除即可。
由于还没解决在android模拟器里无法语音输入的问题,我只好在真机上调试。
4)运行demo
简单试用后,发现效果确实不错。
语音输入提示:
1.png
对句子的识别:
2.png
对一些不良用语的转义(我说“他妈的”):
3.png
蛮有意思的,可见讯飞后台有个很强大的语料库,具备一定的人工智能能力。
不过,还没找到讯飞是如何收费的信息,如果要商用的话,得好好考察一下。以后有时间,可以研究一下这个语音识别的云端是如何实现的,争取能自己搭建一个小型的云服务。

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条