Chinaunix首页 | 论坛 | 博客
  • 博客访问: 4065926
  • 博文数量: 251
  • 博客积分: 11197
  • 博客等级: 上将
  • 技术积分: 6862
  • 用 户 组: 普通用户
  • 注册时间: 2008-12-05 14:41
个人简介

@HUST张友东 work@taobao zyd_com@126.com

文章分类

全部博文(251)

文章存档

2014年(10)

2013年(20)

2012年(22)

2011年(74)

2010年(98)

2009年(27)

分类:

2010-09-28 22:45:03

    若干天前就看到宿舍楼下贴的海报,金院长请了一堆计算机界的牛人来做报告,期待了好几天,今天终于盼到了,到了1号楼才知道,原来是金老师的实验室成立10周年庆典。

    后来看了日程安排,原来我们到的时候已经错过了一个节目,那就是华中科技大学-天涯社区元计算联合实验室华中科技大学-阿里巴巴联合实验室的揭牌仪式,看到院系发展日趋壮大,真是可喜可贺。

    第一个作报告的是哈工大的李建中教授,报告题目为大规模数据集与数据密集型计算,其在VLDBICDE上发表多篇文章,是数据库、数据挖掘方面的权威人物。延续着专家们作报告的老套路,先介绍研究课题的重要性及应用,以吸引听众,李教授举了大量海量数据应用,对于接触存储一年多的我来说,这些例子并不陌生,平时看的一些优秀的论文在做背景介绍时,都会引用这些例子。阐明需求后就是如何解决问题,在此之前,你必须说明现有的系统或方案不能解决(最起码是不能很好的解决)问题,这样你才有提出新解决方案的必要,果然,李教授又逐一说明了现有的数据库、网格计算、分布式计算、云计算都不能很好的适应需求并做了简要的分析,这些用于大规模计算的基础设施被李教授一一摒弃,搞的我有点郁闷了,这些都不行,那还能怎么样,要知道这些东西都不是单一的概念,而是一系列技术的集合。接着李教授说了一些跟解决方案相关的东西,从硬件需求,资源组织,编程模型等各个方面阐述了数据密集型计算(Data Insentive Set ComputingDISC)需要解决的一些问题,给我的感觉是把现有的东西敲碎,对每一个碎片进行修饰,然后再重新拼接,拼接完后就成了传说中的四不像,既然它非AB、非CD,那么它就可能成为一个新的E。这里没有要诋毁李教授的意思,我个人也觉得,很多研究就应该从最小的点做起,拿我的老本行网络来说吧,网络的层次结构,你可以在任意一层做优化,你可以为IP层设计新的路由算法,支持XX速度的包交换,但试想一下,如果你这个XX速度大大超过了物理层网线(如普通双绞线)的承受范围,仅仅改变网络层,而继续使用跟新的网络层(这里指该协议层涉及到的基础设施)不匹配的物理层,是不能从根本上解决问题的,所以要根本的提高网络能力,需结合需求从上到下一级级考虑,但从实现的角度来说,你又必须从下到上一层层封装。从这个角度来说,我是非常赞同李教授的问题打散重来的思路的。

    第二个作报告的是中科院计算所的徐志伟教授,报告题目为三元计算:计算机科学新趋势,从徐教授的言词中可以听得出来,他的行政头衔会多于学术头衔的,他的报告也是八个报告中我感觉最为抽象的,五十分钟的报告,前一刻钟在说闲话,后10分钟要互动,准备好的好多页PPT估计就翻了4-5页,除了获悉其三元计算是指--的三元计算模型,其它的都不知其所云。这里我将第六个报告人上海交通大学过敏意教授的物联网的探索与实践与徐教授报告的主题一起议论下,首先首先这两个教授都跟政府联系很紧密,徐教授热衷于很多公益事业,著有《电脑启示录》,而过教授也因为物联网的产业化经常跟政府打交道,过教授讲述了美国、欧洲、日本、中国的政府对物联网的大力支持与投入,以及物联网的多种应用和关键技术(传感器网络、嵌入式等)。在物联网的世界里,任何物体通过RFID都可以一定程度的智能化,衣服通过RFID告诉智能的洗衣机最合适的水温、智能交通、智能小区、智能冰箱等等,据称上海的宠物都具有RFID标识,以方便对其统一的管理,通过物的智能化实现智慧的地球(最先由IBM提出)。这里就出现一个问题,徐教授说,三元计算(人--物)是计算机科学的趋势,而现今政府把大力弘扬物联网,美国甚至将其复苏经济的重要组成部分,至少最近几年,物联网绝对是个大的趋势,而在物联网的思想里,只有人机这两元实体。那么究竟哪个是趋势呢?

    接下来是浙大计算机学院院长庄越挺教授作关于数字图书馆:云计算的时间的报告,庄教授戏称这是他第一次做挂羊头卖狗肉的事情,说自己并不懂云计算。哎,人总是越到高处越谦虚啊,去的网站上去看看就知道这个项目是做得很不错的,起码我这么觉得。数字图书馆也是海量存储的一个重要应用,若干年前,各个国家比拼图书馆规模、藏书等,在现今信息时代,比拼的是数字资源(文字、图片、音频、视频等),数字图书馆作为国家的重要基础设施,国家自然会大力支持,首先我得佩服浙大人的眼光,看准这一点。第四个作报告的是西安交通大学的郑庆华教授,报告题目为下一代e-Learning系统的总体架构与关键技术,主要内容为其远程教育系统的关键技术,之所以将这两个放在一起说,是因为两位教授的项目都是解决大多数接触得到的问题,而在解决这些问题时,他们有又很多共性的问题。在信息时代,人们不再大老远的跑到图书馆,从茫茫书海中找到自己想要的书籍阅读,他们使用数字图书馆获取信息;人们不再积聚一堂,听老师现场授课,他们使用远程教育系统学习知识。虽然数字图书馆与远程教育这两个东西不怎么沾边,数字图书馆强调丰富正确的资源库、快速的获取资源等;远程教育侧重于人机交互、知识结构链、知识导航等。但要实现的这两个应用,需要解决的共性问题也不少,于是两位教授也讲了不少重复的东西,如数据存储环境(分布式存储系统相关技术)、负载均衡(热门的视频资源、热门的教育课程)、元数据组织与索引(数字资源的快速定位、课程相关知识链的组织)、小文件的存储优化技术。

    听完这两位教授的报告,我发现他们解决问题最终用到的技术(这里指跟存储相关的一些技术,分布式存储、负载均衡、数据分类等)都是我们平时研究的。从我进实验室起,实验室经历了上一个973项目的收尾,一个863项目的子课题,接下来实验室还要做下一个973项目和一项重点科学基金,这几个项目的共同点在于,它们研究的问题都很专,专注于存储技术,当然研究这些技术是有应用的,并且在973申请时,你就必须找好应用伙伴,像上一个973项目武大负责的GIS、灾害预警应用作为海量数据存储研究的应用,但我丝毫没感觉到应用和基础设施间有紧密的联系,下层的结构没有为上层的服务做任何优化,就好像是下面的基础设施是通用的,上面可以作任何的应用,GIS只是其中一个应用,也许国家基础设施研究就只是要这个效果吧,做通用的基础研究。我们的基础设施研究解决了很多重要的问题,取得很多成果(发表很多论文,取得多项发明专利),别人在决绝特定问题时又会将这些问题重新考虑一遍,你发表了论文《A问题的解决方案》,做数字图书馆系统时,又会有一篇《数字图书馆中A问题的解决方案》,还会有很多其他的《xxxA问题的解决方案》,有的论文的确是针对应用对原有的解决方案进行的改进,有的则直接使用原有的解决方案,但因为其解决了一个实际的问题,它变成为有价值的东西,这样造成了学术界大量的冗余论文,不能说是抄袭,但起码说的东西是一模一样的。我们实验室应该做解决通用基础问题的研究还是做解决特定问题的研究呢?

    第五个作报告的是南京大学的周志华教授,报告题目为一种面向多义性对象的机器学习框架及其应用,这位年轻有为也是冗余缠身啊,金老师念他的背景都念了好一会。八个报告里,这个报告的题目我是做陌生的,中午没有午休,原以为我会趁这个报告的时间休息一会的,但没想到这个最年轻教授做的报告却是最精彩的,让我对机器学习都有点东西了,也让我深知算法的重要性。周教授主要讲解其MIML方面的研究,以前在看MIT的语义文件系统(Semantic File System)论文时,对文中提到的分析器,我基本上忽略了它,就是把它当成一个可以可以分析文件并能提取其关键信息的工具,但听了报告后,我才发现这个所谓的分析器设计到多少东西,对于简单的文本,我们可以简单的提取文件的重要元属性还有文本中的关键字,但对于图片,视频这种复杂的对象,这个分析器又会又多复杂呢,一幅图片可能跟很多信息相关(如图片中的人,场景,物体,环境,颜色都是跟图片相关的信息),如何提取信息,分析语义就不是一个简单的问题了,而周教授的MIML相关技术就是解决这类问题,并应用到伯克利大学一个跟信息生物学相关的项目中,为中国人争光,对此我深表敬佩。

    接下来清华大学的舒继武教授关于存储系统的可靠性与低能耗技术的报告,这应该是跟我们联系最紧密的一个报告。激情洋溢的舒教授操一口浓重的湖北口音,应为报告中的主要内容我都懂,所以其不标准而且速度极快的普通话并没有影响到我的理解。但从现场的气氛看,这应该是最不受欢迎的报告,一是内容太偏底层,很多人接触不到;二是其话语太快太难懂,报告中途走了好几个人。舒教授主要讲解了存储可靠性面临的挑战及一些主要解决方案,并从不同层次(介质,系统,数据布局等几个方面)分析了一些节省能耗的技术。最后由国防科技大学的王乾教授作关于虚拟计算环境研究与挑战的报告,最后一个报告也是最难懂的报告,说它难懂不是因为其口音,而是报告内容,60多页PPT,内容很丰富,但一直到最后我还是不能把握关键所在,只是到最后才知道他们做了一个用于解决资源调度与协作的语言owletowlet是使用者负责处理调度逻辑,而不关注调度的实现,使得以前需要上万行代码解决的资源调度问题,只需要百余行的owlet代码就可以解决,并且owlet的代码具有很好的平台无关性。

    本次学术论坛,我受益匪浅,以上为我的一点小言语,欢迎拍砖。

阅读(4192) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~