Chinaunix首页 | 论坛 | 博客
  • 博客访问: 396833
  • 博文数量: 12
  • 博客积分: 6010
  • 博客等级: 准将
  • 技术积分: 790
  • 用 户 组: 普通用户
  • 注册时间: 2005-08-27 22:23
文章分类

全部博文(12)

文章存档

2010年(2)

2009年(4)

2008年(6)

我的朋友

分类:

2008-06-02 13:36:20

Kyle:Hello,little Mike! Mike:Oh shit uncle fucker,please call me Mike. 真后悔让他看南方公园啊,学习能力太强了没办法啊。今天来描述一下我的Robot Mike,呵呵。首先得说话,教会一种人类的语言。 语音能力对人类来说是与生俱来的特异功能,如何把这种特异功能传给机器人呢?极具挑战性。人类都不以未然,语言当然是很简单的啊。其实你去想想我们的编程语言再看看编译器就知道,为什么能够将我们的代码转变为机器码,这中间过程其实很复杂,但是相对自然语言来说就简单多了。就仅仅看看规则就知道复杂度不是一个等级的了,暂排除发音差别和语境影响,仅仅说词法、语法分析,对自然语言做分词和语法分析就很有挑战性了哦。能不能像编译器一样设计一种类似汇编的元语言,然后再将语言识别分解为元语言再进行分析呢?先看看现有的几个比较好的实现: 1、微软提供了语音识别的SDK,不过都是封装好的,不透明(微软的风格,没办法),不过整句识别的准确率较高。 2、剑桥的HTK,单词识别准确率很高,不过整句识别较低。 特别是Mike以后生活在中国,必须要学会说汉语啊,这下可麻烦了,汉语这么博大精深的语言,怎么才能交给这个只知道0、1的小伙计呢?Mike采用的是我们自己的SRS系统,能够准确的识别汉语,能够自动适应各种方言的发音。会听会说了,下面要学会看,还是模拟人吧,双目视觉系统。 不过,现在的视觉只是在特定的环境中对特定的场景和特定的物体进行判断、识别,并且环境影响因素很多,还要达到实时的要求,能处理各种突发事件。Intel的OpenCV还可以,但是适用范围不广,不能做的普适。Mike的视觉系统ES是一种普适的识别系统,在各种环境下都能和人一样识别出周围的环境,利用纹理和结构来区别物体。 会说会看了,还要把自己听到看到的东西告诉远方的朋友,因此要给他配个电话撒。移动、联通?No. Mike使用新一代无线电话,采用CR技术,在什么情况下都可以找到可以利用的frequency,所以他的电话不会出现网络忙不能使用的状况。还能利用无线连接到interenet,没事无聊的时候一个人写写blog,不过是盗用了我的blog的帐户和密码,faint不应该教他看协议的。 呵呵,我的娱乐之作,无聊之余想想未来也不错哦。 大家轻轻的拍下,不要太重了。 呵呵。
阅读(948) | 评论(2) | 转发(0) |
0

上一篇:Mike

下一篇:这是撒现象哦

给主人留下些什么吧!~~

chinaunix网友2008-06-29 17:23:30

很好很强大,看到前面以为做成这个样子了,正想赞叹牛逼阿 看了最后一句,原来是想象,不过还是很强大,哈哈

chinaunix网友2008-06-29 17:23:30

很好很强大,看到前面以为做成这个样子了,正想赞叹牛逼阿 看了最后一句,原来是想象,不过还是很强大,哈哈