Chinaunix首页 | 论坛 | 博客
  • 博客访问: 8395
  • 博文数量: 8
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 122
  • 用 户 组: 普通用户
  • 注册时间: 2014-11-18 11:03
文章分类
文章存档

2015年(1)

2014年(7)

我的朋友

分类: IT业界

2014-11-19 17:06:25

谷歌(微博)多名研究人员日前发博客透露,谷歌想要为复杂图片开发一种能够提供自动字幕的技术,其可精准描述图片中的内容,而且他们正接近实现这个目标。
谷歌的机器学习系统可以“看到”照片,然后自动生成描述和相关说明。这套系统通过识别图片上不同对象以及它们之间的互相关系,对图片上的内容进行更深层次的解读,最后翻译成更为自然的描述。
谷歌研究员奥利奥尔·温雅尔斯(Oriol Vinyals)、亚历山大·托舍夫(Alexander Toshev)、萨米·本吉奥(Samy Bengio)以及杜米特鲁·艾尔罕(Dumitru Erhan)等人写道:“这种系统最终可以帮助视障人士了解照片,在世界上移动连接速度很慢的部分地区提供替代文本,使用户更容易在谷歌上搜索图像。”
谷歌团队的关键创新是,将计算机视觉系统(在图片中将对象分类)与自然语言程序模式结合起来,当这套系统看到图片后,可以直接生成语句描述它。
谷歌研究人员承认,这套系统依然有许多工作需要改进。他们称:“我们将继续研发这套系统,期望它能够读取照片,并能生成足够好的自然语言描述。”
阅读(68) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~