存储方式与介质对性能的影响-g

Gan's Bloggan.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

g_hk

博客访问： 4072220
博文数量： 536
博客积分： 10470
博客等级：上将
技术积分： 4825
用户组：普通用户
注册时间： 2006-05-26 14:08

文章分类

全部博文（536）

pg（1）
计算机的东西（404）

考试（5）

ASM（13）

python（1）

C（17）

VC++（1）

SQL_PL/SQL（29）

OCP（1）

about（2）

assembler（0）

other（18）

数据库（3）

BI（2）

vi（5）

BDB（4）

shell（22）

embed（4）

cpu（2）

socket（3）

makefile（0）

QT（1）

c（26）

gdb（6）

gcc（4）

NFS（4）

AIX（4）

Block（5）

站内查询（0）

我的源码库（3）

小软件（1）

Windows（3）

perl（2）

HP-UX（2）

PHP（1）

硬件介绍（1）

备份软件（7）

备份知识学习（0）

小点子（2）

Linux内核开发（30）

TCP/IP学习（6）

ERRORS（8）

DATA_DICTIONARY（3）

Oracle（50）

Linux_C（2）

软件设计（6）

软件开发问题（2）

开发体会（3）

UNIX/LINUX（5）

OCI（5）

TRANSACTION（4）

DATATYPE（15）

开发（17）

Linux_C（15）

OTHER（7）

Linux_C（18）

pthread（3）
其他（55）

记录（1）

出师（0）

销售（8）

影视（2）

读书（12）

预言（3）

财经（8）

感动（5）
职业规划（11）
学习E文（8）
News（18）
未分配的博文（39）

文章存档

2024年（3）

2021年（1）

2019年（1）

2017年（1）

2016年（2）

2013年（2）

2012年（10）

2011年（43）

2010年（10）

2009年（17）

2008年（121）

2007年（252）

2006年（73）

我的朋友

pwrite/fwrite

最后，说一下pwrite/fwrite。虽然他们的功能都是将内存中的数据存入文件。但原理和过程都有所不同。刚刚说过pwrite是属于文件IO，数据流是从“进程=>fd=>文件”，而fwrite是流/标准IO，其数据流是从“进程=>fp(FILE对象)=>流/缓冲=>文件”；原本直接对文件的操作，在 fwrite库函数中变为对流对象的操作，而“流=>文件”这一层的操作将由库函数为我们完成。流的逻辑表示就是FILE对象，而流的实体就是流使用的缓冲区，这些缓冲区相对于应用进程来说就是文件的代表。

完全随机写还是跳跃，5倍的性能差距

全随机写无疑是最慢的写入方式，在logic dump测试中很惊讶的发现，将200M的内存数据随机的写入到100G的磁盘数据里面，竟然要2个小时之多。原因就是虽然只有200M的数据，但实际上却是200万次随机写，根据测试，在2850机器上，这样完全的随机写，r/s 大约在150～350之间，在180机器上，r/s难以达到250，这样计算，难怪需要2～3个小时之久。

如何改进这种单线程随机写慢的问题呢。一种方法就是尽量将完全随机写变成有序的跳跃随机写。实现方式，可以是简单的在内存中缓存一段时间，然后排序，使得在写盘的时候，不是完全随机的，而是使得磁盘磁头的移动只向一个方向。根据测试，再一次让我震惊，简单的先在内存中排序，竟然直接使得写盘时间缩短到 1645秒，磁盘的r/s也因此提升到1000以上。写盘的速度，一下子提高了5倍。

一个需要注意的地方，这种跳跃写对性能的提升，来至与磁头的单方向移动，它非常容易受其他因素的影响。测试中，上面提到的测试是只写block文件，但如果在每个tid的处理中再增加一个写index的小文件。虽然如果只写index小文件，所用时间几乎可以忽略，但如果夹杂在写block文件中间的话，对整体的写性能可能影响巨大，因为他可能使得磁盘的磁头需要这两个地方来回跑。根据测试，如果只写index文件，只需要300s就可以写完所有200万个 tid，单如果将写索引和写block放在一起，总时间就远大于分别写这两部分的时间的和。针对这种情况，一种解决方案就是就不要将小数据量的数据实时的刷盘，使用应用层的cache来缓存小数据量的index，这样就可以消除对写block文件的影响。

从原理上解释上面的表象，一般来说，硬盘读取数据的过程是这样的，首先是将磁头移动到磁盘上数据所在的区域，然后才能进行读取工作。磁头移动的过程又可以分解为两个步骤，其一是移动磁头到指定的磁道，也就是寻道，这是一个在磁盘盘片径向上移动的步骤，花费的时间被称为“寻道时间”；其二就是旋转盘片到相应扇区，花费的时间被称为“潜伏时间”（也被称为延迟）。那么也就是说在硬盘上读取数据之前，做准备工作上需要花的时间主要就是“寻道时间”和“潜伏时间”的总和。真正的数据读取时间，是由读取数据大小和磁盘密度、磁盘转速决定的固定值，在应用层没有办法改变，但应用层缺可以通过改变对磁盘的访问模式来减少 “寻道时间”和“潜伏时间”，我们上面提到的在应用层使用cache然后排序的方式，无疑就是缩短了磁盘的寻址时间。由于磁头是物理设备，也很容易理解，为什么中间插入对其他小文件的读写会导致速度变慢很多。

建议：尽量避免完全的随机写，在不能使用多线处理的时候，尽量使用应用层cache，确保写盘时尽量有顺序性。对于小数据量的其他文件，可以一直保存在应用层cache里面，避免对其他大数据量的数据写入产生影响。

多线程随机读、处理速度、响应时间

多线程随机读的处理速度可以达到单线程随机读的10倍以上，但同上也带来了响应时间的增大。测试结论如下：（每个线程尽量读）

读线程数	读出100次耗时（um）	读平均相应时间（um）
1	1329574	13291
5	251765	12976
10	149206	15987
20	126755	25450
50	96595	48351

结论标明增加线程数，可以有效的提升程序整体的io处理速度。但同时，也使得每个io请求的响应时间上升很多。

从底层的实现上解释这个现象：应用层的io请求在内核态会加入到io请求队列里面。内核在处理io请求的时候，并不是简单的先到先处理，而是根据磁盘的特性，使用某种电梯算法，在处理完一个io请求后，会优先处理最临近的io请求。这样可以有效的减少磁盘的寻道时间，从而提升了系统整体的io处理速度。但对于每一个io请求来看，由于可能需要在队列里面等待，所以响应时间会有所提升。

响应时间上升，应该主要是由于我们测试的时候采用每个线程都尽量读的方式。在实际的应用中，我们的程序都没有达到这种压力。所以，在io成为瓶颈的程序里面，应该尽量使用多线程并行处理不同的请求。对于线程数的选择，还需要通过性能测试来衡量。

系统缓存

系统缓存相关的几个内核参数

/proc/sys/vm/dirty_background_ratio
该文件表示脏数据到达系统整体内存的百分比，此时触发pdflush进程把脏数据写回磁盘。
缺省设置：10
/proc/sys/vm/dirty_expire_centisecs
该文件表示如果脏数据在内存中驻留时间超过该值，pdflush进程在下一次将把这些数据写回磁盘。
缺省设置：3000（1/100秒）
/proc/sys/vm/dirty_ratio
该文件表示如果进程产生的脏数据到达系统整体内存的百分比，此时进程自行把脏数据写回磁盘。
缺省设置：40
/proc/sys/vm/dirty_writeback_centisecs
该文件表示pdflush进程周期性间隔多久把脏数据写回磁盘。
缺省设置：500（1/100秒）

dirty页的write back

系统通常会在下面三种情况下回写dirty页

定时方式: 定时回写是基于这样的原则:/proc/sys/vm/dirty_writeback_centisecs的值表示多长时间会启动回写线程,由这个定时器启动的回写线程只回写在内存中为dirty时间超过(/proc/sys/vm/didirty_expire_centisecs / 100)秒的页(这个值默认是3000,也就是30秒),一般情况下dirty_writeback_centisecs的值是500,也就是5秒,所以默认情况下系统会5秒钟启动一次回写线程,把dirty时间超过30秒的页回写,要注意的是,这种方式启动的回写线程只回写超时的dirty页，不会回写没超时的dirty页,可以通过修改/proc中的这两个值，细节查看内核函数wb_kupdate。
内存不足的时候: 这时并不将所有的dirty页写到磁盘,而是每次写大概1024个页面,直到空闲页面满足需求为止
写操作时发现脏页超过一定比例: 当脏页占系统内存的比例超过/proc/sys/vm/dirty_background_ratio 的时候,write系统调用会唤醒pdflush回写dirty page,直到脏页比例低于/proc/sys/vm/dirty_background_ratio,但write系统调用不会被阻塞,立即返回.当脏页占系统内存的比例超/proc/sys/vm/dirty_ratio的时候, write系统调用会被被阻塞,主动回写dirty page,直到脏页比例低于/proc/sys/vm/dirty_ratio

总结

本文给大家提供了一份不同存储模式下的性能测试数据，方便大家在今后的程序开发过程中可以利用这份数据选择合适的数据存储模式。同时讲述了关于文件IO读写操作以及系统缓存层面的一些问题。

Ref: http://blog.163.com/zhaoxin851055@126/blog/static/811292982012112421330845/

阅读(1259) | 评论(0) | 转发(0) |

上一篇：ftp mget不用输入确认

下一篇：postgresql oid类型操作体会

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6