Chinaunix首页 | 论坛 | 博客
  • 博客访问: 87650
  • 博文数量: 56
  • 博客积分: 1647
  • 博客等级: 上尉
  • 技术积分: 675
  • 用 户 组: 普通用户
  • 注册时间: 2012-04-24 11:01
文章分类

全部博文(56)

文章存档

2014年(2)

2013年(1)

2012年(53)

我的朋友

分类: IT业界

2012-05-21 10:55:21

天下数据专业提供数据库服务,等等,天下数据用非常生动的语言描述了人际关系与关系型数据库之间的联系,并对图形在数据库方面的应用进行了阐述。

当使用关系型数据库的时候,DBA往往将连接表视为一个“二等公民”。如果幸运的话,它们可能会得到一些额外的字段,但是通常只能用placeholder table把你的主对象表连在一起。这种情况下,DBA首先考虑的永远是对象,其次才是关系。但是在使用图形的时候,你可能就需要转换一下思维了。DBA首先要想的是事物之间是如何联系起来的,是通过哪几种不同的方式联系起来的。两个人可以是朋友,可以是同事,也可以是邻居,当然这些关系还可以同事存在。

  上过大学的人都知道,撰写毕业论文的时候会用到研究报告、学术期刊以及引用的资料等等。它们之间又存在怎样的关系呢?研究报告中,一般都是多个作者合著的,多个作者就意味着你可以创建一个合著人的图形。回答哪些研究员和学生共同完成了这个报告,哪些人员应该共同完成的问题。而科学研究则依赖于其他的事物,之前的研究可以用来创建一个引用的图形。摘要中的关键字或者论文摘录可以用来创建类似内容的一个图形。

  那么进一步想想Twitter这样的社交网络,它们可以有关注者图形、回复图形、转推图形、标签图形、共享URL图形。那么博客呢?它们有链接图形、友链图形还有标签图形。

  一旦开始深入地探寻数据,你就会惊讶于它们之间的联系。不必太在乎你的数据模型,就从你所知道的开始做起,当数据变得明显的时就添加节点和关系。这样的话你的模型也会逐渐清晰,所以不要先猜来猜去浪费时间。

当人们问我如何建模的时候,我会告诉他们先从你想要回答的问题开始。当然这还不够,当你已经回答了这些问题之后,你就能发现更多的问题。你会说,如果我有这些额外的数据,我就能提出并回答一堆新的问题,而这些问题是我之前完全没有想到的。

所以,问题会无限期的增长下去。

 

 

阅读(438) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~