一个实例讲解MySQL查询优化（三）-youngpand-ChinaUnix博客

youngpand(www.9limi.cn)youngpand.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

youngpand

博客访问： 987357
博文数量： 335
博客积分： 10287
博客等级：上将
技术积分： 3300
用户组：普通用户
注册时间： 2005-08-08 15:29

文章分类

全部博文（335）

Python（1）
前端开发技术（1）
Ubunto（2）
Ubunto（0）
Lucene全文检索（4）
mysql优化（3）
算法（1）
PHP性能优化（6）
Lighttpd（3）
论坛（1）
PHP+APACHE相关（27）

函数使用技巧（1）

URL转发（1）
开发协议（8）
Berkeley DB数据（2）
LDAP相关（3）
其他篇（15）
Ajax文章 && WEB2（8）

ExtJS（0）
版本控制（16）

subversion（9）
无线网络篇（6）
MS SQL（1）
PERL学习（4）
ORACLE数据库（9）
JAVA开发（12）
MySQL数据库（29）
生活源于创造（20）

理财类（2）
C/C++开发（90）

SOCKET编程（2）

ACE专栏（8）

FastCGI&CGI（1）

C/C++基础（40）

多线程编程（27）
操作系统（63）

Android（3）
未分配的博文（0）

文章存档

2015年（4）

2014年（15）

2013年（17）

2012年（11）

2011年（12）

2010年（96）

2009年（27）

2008年（34）

2007年（43）

2006年（39）

2005年（37）

我的朋友

相关博文

一个实例讲解MySQL查询优化（三）

分类： Mysql/postgreSQL

2005-08-18 11:23:04

实例分析

　　下面我们举一个制造公司的例子来说明如何进行查询优化。制造公司数据库中包括3个表，模式如下所示:

　　1.part表

　　零件号?????零件描述????????其他列

　　(part_num)?(part_desc)??????(other column)

　　102，032???Seageat 30G disk?????……

　　500，049???Novel 10M network card??……

　　……

实例分析

　　下面我们举一个制造公司的例子来说明如何进行查询优化。制造公司数据库中包括3个表，模式如下所示:

　　1.part表

　　零件号?????零件描述????????其他列

　　(part_num)?(part_desc)??????(other column)

　　102，032???Seageat 30G disk?????……

　　500，049???Novel 10M network card??……

　　……

　　2.vendor表

　　厂商号??????厂商名??????其他列

　　(vendor _num)?(vendor_name) (other column)

　　910，257?????Seageat Corp???……

　　523，045?????IBM Corp?????……

　　……

　　3.parven表

　　零件号?????厂商号?????零件数量

　　(part_num)?(vendor_num)?(part_amount)

　　102，032????910，257????3,450,000

　　234，423????321，001????4，000，000

　　……

　　下面的查询将在这些表上定期运行，并产生关于所有零件数量的报表:

　　SELECT part_desc，vendor_name，part_amount

　　FROM part，vendor，parven

　　WHERE part.part_num=parven.part_num

　　AND parven.vendor_num = vendor.vendor_num

　　ORDER BY part.part_num

　　如果不建立索引，上述查询代码的开销将十分巨大。为此，我们在零件号和厂商号上建立索引。索引的建立避免了在嵌套中反复扫描。关于表与索引的统计信息如下:

　　表?????行尺寸???行数量?????每页行数量???数据页数量

　　(table)?(row size)?(Row count)?(Rows/Pages)?(Data Pages)

　　part????150?????10，000????25???????400

　　Vendor???150?????1，000???? 25???????40

　　Parven???13????? 15，000????300?????? 50

　　索引?????键尺寸???每页键数量???页面数量

　　(Indexes)?(Key Size)?(Keys/Page)???(Leaf Pages)

　　part?????4??????500???????20

　　Vendor????4??????500???????2

　　Parven????8??????250???????60

　　看起来是个相对简单的3表连接，但是其查询开销是很大的。通过查看系统表可以看到，在part_num上和vendor_num上有簇索引，因此索引是按照物理顺序存放的。parven表没有特定的存放次序。这些表的大小说明从缓冲页中非顺序存取的成功率很小。此语句的优化查询规划是:首先从part中顺序读取400页，然后再对parven表非顺序存取1万次，每次2页(一个索引页、一个数据页)，总计2万个磁盘页，最后对vendor表非顺序存取1.5万次，合3万个磁盘页。可以看出在这个索引好的连接上花费的磁盘存取为5.04万次。

　　实际上，我们可以通过使用临时表分3个步骤来提高查询效率:

　　1.从parven表中按vendor_num的次序读数据:

　　SELECT part_num，vendor_num，price

　　FROM parven

　　ORDER BY vendor_num

　　INTO temp pv_by_vn

　　这个语句顺序读parven(50页)，写一个临时表(50页)，并排序。假定排序的开销为200页，总共是300页。

　　2.把临时表和vendor表连接，把结果输出到一个临时表，并按part_num排序:

　　SELECT pv_by_vn，* vendor.vendor_num

　　FROM pv_by_vn，vendor

　　WHERE pv_by_vn.vendor_num=vendor.vendor_num

　　ORDER BY pv_by_vn.part_num

　　INTO TMP pvvn_by_pn

　　DROP TABLE pv_by_vn

　　这个查询读取pv_by_vn(50页)，它通过索引存取vendor表1.5万次，但由于按vendor_num次序排列，实际上只是通过索引顺序地读vendor表(40+2=42页)，输出的表每页约95行，共160页。写并存取这些页引发5*160=800次的读写，索引共读写892页。

　　3.把输出和part连接得到最后的结果:

　　SELECT pvvn_by_pn.*，part.part_desc

　　FROM pvvn_by_pn，part

　　WHERE pvvn_by_pn.part_num=part.part_num

　　DROP TABLE pvvn_by_pn

　　这样，查询顺序地读pvvn_by_pn(160页)，通过索引读part表1.5万次，由于建有索引，所以实际上进行1772次磁盘读写，优化比例为30∶1。笔者在Informix Dynamic

　　Sever上做同样的实验，发现在时间耗费上的优化比例为5∶1(如果增加数据量，比例可能会更大)。

　　小结

　　20%的代码用去了80%的时间，这是程序设计中的一个著名定律，在数据库应用程序中也同样如此。我们的优化要抓住关键问题，对于数据库应用程序来说，重点在于SQL的执行效率。查询优化的重点环节是使得数据库服务器少从磁盘中读数据以及顺序读页而不是非顺序读页。

阅读(832) | 评论(0) | 转发(0) |

上一篇：一个实例讲解MySQL查询优化（二）

下一篇：为 Linux 和 Windows 安装 PHP 和 Oracle 10g Instant Clie

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6