Chinaunix首页 | 论坛 | 博客
  • 博客访问: 48052
  • 博文数量: 14
  • 博客积分: 74
  • 博客等级: 民兵
  • 技术积分: 85
  • 用 户 组: 普通用户
  • 注册时间: 2011-11-17 22:42
文章分类
文章存档

2012年(5)

2011年(9)

我的朋友

分类:

2012-01-21 00:54:57

[API]Google的语音识别API,支持各种语言

没 真的智能机的孩子你伤不起啊有木有!成天都是倒霉Symbian60啊有木有!上次超流量下载了Google Search for S60,里面神奇的有“语音搜索”……然后就是今天碰到android手机了,自带一个语音输入法啊!这准确率杆杆地!不过根据我多秒经验,S60的废柴 API库绝对没有这么完美的语音识别(玩过诺基亚的应该都知道,待机状态长按右软件那个出来的是自带的识别功能),所以肯定Google留了一手!


(软件见)

废话多了,现在看看Google的猥琐API之STT!(属于speech-api v1的recognize)

不过使用不是那么简单的哦……

如何调用

要使用这个API,你得先有一些心理素质:面对倒霉的FLAC格式,因为这个API只支持FLAC格式的数据,杯具啊。

不过你找到了我的博客,那么你是幸福的,因为我已经为你准备了不少好东西了。(顺便说一句,如果要转载记得清楚地标注“来自http://blog.laobubu.net”,我信任你。)

现在看看如何请求数据:

  • 【URL】
  • 【方式】POST
  • 【请求头】Content-Type:audio/x-flac; rate=16000
  • 【POST】flac文件的数据

如果你人品大爆发,你成功了,可以得到类似这个的结果

{"status":0,"id":"54e1babccaa58682ffbb02ceb42aa47c-1", "hypotheses":[{"utterance":"测试程序","confidence":0.8556527}]}

不过不简单哦

实例:用于Python
#By laobubu.net
  1.  
  2. import urllib2
  3. FILE='1.flac' #这里假设在当前文件夹下有一个叫1.flac的文件被识别
  4. url = ''
  5. audio=open(FILE,'rb').read()
  6. headers = {'Content-Type' : 'audio/x-flac; rate=16000'}
  7. req = urllib2.Request(url, audio, headers)
  8. response = urllib2.urlopen(req)
  9. print response.read().decode('UTF-8')
头疼:FLAC文件格式

这里我长话短说,google的flac也有限制,22050 Hz 201kbps还正常,如果比这个大多了就不对了。

不过还有最要命的问题,怎么生成FLAC文件?

没关系,这里有救星:flac.exe包下载

 (跟你说的,上laobubu.net没错的)

具体使用方法是【flac.exe 文件.wav】这样在命令行调用即可,测试得知:不支持MP3等格式,但是支持基本的wav格式。

好了,你可以去制造你的app了,哈哈。

爱你:来自laobubu实验室的福音

为了方便,我写了一个python程序,放在Google App Engine上面,只要提交一个音频文件的URL(支持MP3、wav等常见格式),且文件不大,就可以得到结果了哦。(再次强调,跟你说的,上laobubu.net没错的)

API入口:
备用入口:

喜欢的话记得 1哦,当然我最不介意 :)

阅读(3124) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~