Chinaunix首页 | 论坛 | 博客
  • 博客访问: 22531
  • 博文数量: 48
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 458
  • 用 户 组: 普通用户
  • 注册时间: 2022-08-23 23:07
文章分类
文章存档

2022年(48)

我的朋友
最近访客

分类: 大数据

2022-10-27 12:56:51



日,清华大学主楼报告厅迎来了人工智能的一次小高潮。

被称为“人工智能三巨头”之一的蒙特利尔大学计算机科学与运算研究系教授

Yoshua Bengio

为清华的师生带来了一场长达一个半小时的充实演讲。

刚刚入场就被清华同学团团围住签名合照的Yoshua教授

本次计算机科学与系列讲座第59讲暨CCF YOCEEF TDS Special系列讲座,Yoshua Bengio带来的主题讲座名为《深度学习抵达人类水平面临的挑战(Challenges for Deep Learning towards Human-Level AI》。

本次演讲讲述了人工智能尚未达到人类水平的原因,以及机器学习和自然语言处理遇到的挑战,整个演讲娓娓道来且让人意犹未尽。


在演讲中,Bengio提到AI如今的大获成功主要是靠有监督学习,而有监督学习里的高级概念(比如label)是人类给的,不是机器自己去发现的。没有这个主动认知的过程,机器对数据的理解其实是相当肤浅的,改几个像素就会错把狗的图片当成鸵鸟。


Bengio和Yann LeCun在2007年的一篇论文里提出:我们需要学到一个好的表示。好的表示到底是什么,这尚无定论,但我们希望学到的表示能抓住事物的原因和数据的内在解释。


Bengio进一步认识到,既然好的表示可以得到简单的相关性,又没有免费的午餐,那么就一定需要先验去辅助分离内在的因子变量。

这类先验可以是空间和时间尺度上的先验(比如变量变化的快慢),也可以是高层表示之间应具有统计独立性。

好的表示还应具有这样的先验:能把数据映射到一个空间,在这个空间里做什么都很简单,计算简单、学习简单、因子之间的相关也很简单。

还有一类先验不是被动给予的,而是主动与环境交互获取的,这是强化学习的范畴。


心理学家提出认知任务有两种不同类型,这可以帮助我们理解深度学习当前存在的局限,以及该向何处发展。

{BANNED}中国第一类认知任务是可以快速完成的、无意识的动作,比如口渴时一下就能把水杯拿起来喝水,而不是盯着水杯刻意地识别它。

第二类任务则是速度较慢的、有意识的,包含逻辑、语言、计算等。经典符号AI曾经尝试去解决这类任务。


意识空间里的事物维度很低,因此我们能在这样的空间里进行推理。

“下雨时打伞”,这个句子虽然只有“下雨”和“打伞”两个变量,但因为它高概率为真,所以具有很强的预测能力,这说明仅用很少的信息就能做出预测。

意识先验就是假设有很多只包含很少变量但为真的事情,因此,好的表示的一个性质,就是当我们把数据映射到表示空间之后,变量之间只有少数相关。

我们也可以在这样的空间里讨论变量的因果性:在像素空间里说一个像素引起另一个像素的变化是没有意义的,但在表示空间里就可以说一个变量引起另一变量的变化。


无意识状态是高维的,有意识状态是低维的,可以用注意力机制选择较少维度去表示有意识状态。


借鉴GAN的思想,训练可区分来自P(A,B)和P(A)P(B)这两个分布的(A,B)的判别器,如果区分不出则说明它们是独立的。这样可以让encoder学到的表示尽可能独立。


直接计算互信息往往是困难的,我们也可以用类似的思想,用判别器去学习互信息的估计。这样学到的互信息估计可用来提高GAN的性能。


现在的NLP任务只是在文本上训练模型。


这样会出现很多常识性的错误,因为它并没有理解语言内在的含义。


想要真正理解自然语言,不仅要对语言本身建模,还要对所处环境进行建模。要将语言学习和世界运转方式的学习相结合。


机器需要对事物之间的因果联系进行建模。


BabyAI通过19个由易到难的游戏关卡而不断学习,就像婴儿成长的过程一样。这很像课程学习(curriculum learning)。



阅读(221) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~