分类: 架构设计与优化
2018-01-10 16:17:24
DB2体系结构
DB2 for LUW进程模型在DB2v9.5之前都是多进程模型,DB2 v9.5之后体系架构变更为单进程多线程模型。
是一个C/S结构,客户端可以通过TCP/IP或IPC协议与服务器通信,每当客户端与服务器建立连接之后,会在服务器端产生一个代理线程(db2agent)负责处理来自客户端的所有请求,但是当某一时刻并发请求很多或者连接断开时,重复地产生与销毁代理线程会产生很大的系统开销,所以DB2服务器在启动时创建一个常连接池来避免重复地创建/销毁代理线程。
但是如果某一个处理的请求非常大时,如果单个线程去处理效率比较低下,为了提高单个请求的处理能力,与客户端通信的那个代理线程(db2agent)可以从线程池中额外召集几个线程(db2agentp)来共同处理某个请求。
DB2的线程分类
常连接池内的线程db2agent和db2agentp处理客户端请求,比如从bufferpool中取请求的数据,或者将请求拆解放到预取(prefetch)队列中供预取进程(prefetcher)从磁盘取数据使用、或者将一些DML操作记录到日志缓冲区(logbuffer)中等。
通信管理线程db2tcpcm和db2ipccm负责对来自客户端的连接请求进行安全验证和检查,并与客户端实现三次握手连接。
数据页预取进程db2pfchr/页面清理进程db2pclnr当请求的数据不在bufferpool中时,需要预取进程db2pfchr通过异步读数据的方式将将所需数据从磁盘读入bufferpool中。
DB2对数据的操纵主要在bufferpool中进行,当插入某些数据或对某些数据做了变更后形成脏页(dirtypage)后,需要使用线程db2pclnr根据一定的机制定期清理bufferpool中的脏页,一方面持久化数据,另一方面给bufferpool腾出更多可置换空间供使用。
日志页读写进程db2loggr/db2loggwDB2采用的是读日志优先(Readlog ahead)的策略来持久化数据,即在将insert/delete/update的数据写入磁盘前,必须先将对这些操作的日志从日志缓冲区持久化到磁盘当中,这个操作由db2loggw线程完成。
当需要使用持久化到磁盘的日志恢复或撤销某些操作时,需要从磁盘中将对应的日志读入到日志缓冲区中,此时有db2loggr线程完成。
全局死锁检测线程db2dlock该线程主要是检测系统死锁防止因为死锁造成的应用不可用。
以下为部分常见DB2管理工具和实例:
DB2实例命令
MySQL的体系架构如上图所示,可将其划分为以下三个逻辑层:
应用层(Application Layer)应用层
ApplicationLayer
MySQL管理工具和应用实例(Administrator&Utilities)
主要是连接到MySQL服务器检索、修改或增加数据,有以下常见MySQL管理工具或实用程序。
本地查询接口(Query Interface)
MySQL查询接口主要指mysql脚本,使用mysql工具可以直接与MySQL服务器交互,是日常与MySQL服务器打交道最频繁的工具。
客户端应用接口(Client API)
客户端应用接口主要是使用MySQL服务器对外公布的一些API调用访问数据库,主要有CAPI、Python API以及JavaAPI。
逻辑层
LogicalLayer
MySQL逻辑层主要是包括以下几个功能:
SQL引擎编译SQL语句将客户端发送的SQL语句请求通过SQL引擎将SQL语句编译成MySQL服务器内部存取数据的指令的过程,编译过程包括查询解析(QueryParser)、查询检查(Query check),查询优化(QueryOptimizer)以及查询执行(Query Excution)四个阶段。
事务控制事务(Transaction)是由一组SQL语句组成的逻辑处理单元,这个逻辑处理单元被原子性地处理,即要么其中的所有SQL语句全部执行成功,要么全部失败,没有第三种可能。那么MySQL是怎么保证事务被原子性地处理呢?这就是Transactionmanagement组件的功能了。当事务全部处理完毕时,通过该组件完成决定commit还是rollback操作。
日志管理数据库需要将所有对数据变更的操作记录下来,以便当数据库发生crash时做Redo或Undo操作,或者在分布式结构中将操作通过从一个计算节点共享到其他计算节点,这些功能都是通过事务日志来控制的。
MySQL的事务日志管理系统是Recoverymanagement组件,主要功能是持久化事务日志以及当数据库crash时将数据库恢复到crash之前的一致性状态。
存储管理(Storage management)数据库中操作数据的主要场所是bufferpools,怎么控制数据页和索引页在bufferpool中的状态就是通过storagemanagement完成的,该组件主要还是对Page层面的管理,包括将页读入内存、页的清理等。
值得一提的是,MySQL的逻辑层的上述几个组件功能并不是MySQL特有的,而是普遍适用于DB2/Oracle等常见关系型数据库。
物理层
PhysicalLayer
数据库的物理层主要关注的是数据怎么落地存储以及被有效访问的问题,MySQL的物理层设计比较特殊,MySQL提供了多种存储引擎供用户选择,而且这些存储引擎是可插拔的(Pluggable),这是区别于业内其他关系型数据库的一个很重要的特征。
MySQL数据库为用户提供了20多种可插拔的存储引擎,比较常见的有如下列表所示几种:
如上图的存储引擎中,从功能上比较接近商业数据库功能的是InnoDB存储引擎。从MySQL5.5开始,InnoDB成为MySQL服务器的默认存储引擎;而早在SunMicroSystem被Oracle收购之前的2005年,InnoDB存储引擎就被Oracle收购。
相比较于其他MySQL存储引擎,MySQLInnoDB存储引擎支持以下关键特性:
以下以InnoDB内部是怎么和磁盘文件交互的详细架构示意图
如下图是支持访问MySQL数据库服务器的API接口类型,可以通过编写程序调用四种API接口访问MySQL数据库:
JDBC with Connector/J通过Java程序访问MySQL服务器
.NET with Connector/NET使用.NET程序访问MySQL服务器
ODBC with Connector/ODBC使用基于C语言库的编程语言,比如C/C++语言、Python/PHP/Perl/Ruby语言等访问MySQL数据库。
总之,MYSQL支持通过当前最流行的几种主流语言访问。
阅读原文