从网络管理员到DBA的奋斗之路feihong.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

博客访问： 7665610
博文数量： 368
博客积分： 9600
博客等级：上校
技术积分： 18875
用户组：普通用户
注册时间： 2009-01-01 00:00

文章分类

全部博文（368）

生活感悟（1）
每日精进（1）
普洱茶（4）
自动化运维（3）
学习笔记（19）
IT职场（12）
分布式文件系统学（2）
perl学习（11）
安全（1）
windows（2）
oracle学习笔记（6）
electro-server（1）
SmartFoxServer（2）
监控（12）
工作记录（21）
English Study（4）
电脑维护（6）
高可用（17）

mysql高可用方案（8）
mail（3）
LVM_RAID（6）
mysql（107）

mysql实用工具（10）

mysql cluster（22）
DNS--bind（4）
vpn（1）
cache（4）
web_server（32）
生活杂谈（5）
linux系统（51）

杂项（21）

linux文件（2）

基本命令（17）

FTP（5）
shell学习（25）

实用shell脚本（6）

其他shell命令学（9）

sed学习（2）

awk学习（4）
未分配的博文（5）

文章存档

2017年（9）

2016年（19）

2015年（3）

2014年（6）

2013年（8）

2012年（78）

2011年（66）

2010年（135）

2009年（44）

我的朋友

一、Spider引擎简介

1、spider引擎是什么

spider引擎是一个内置的支持数据分片特性的存储引擎，支持分区和XA事务，该引擎可以在服务器上建立和远程服务器表之间的链接，操作起来就像操作本地的表一样。并且后端可以是任何的存储引擎。spider引擎根据表的设置的规则以及server表的规则自动进行智能路由，实现对后端数据库不通的表或者数据分片的访问和修改。因此该引擎对业务是完全透明的。目前spider引擎已经集成到了MariaDB中，安装使用非常方面，目前最新的版本是Spider 3.2.37。更多信息可以访问：，具体的版本历史如下图所示：

2、spider架构图

3、Spider的优势

a、对业务完全透明，业务不需要做任何的修改

对于分库分表的逻辑业务不需要关心，只需要通过spider作为代理入口，访问数据对应在后端哪台server上spider自动帮你处理。

b、方便横向扩展，能解决单台mysql得性能和存储瓶颈问题

c、对后端的存储引擎没有限制

d、间接实现垂直拆分和水平拆分功能

通过spider和后端的数据库连接，可以是独立的表，也可以是基于分区表，分区表支持哈希、范围、列表等算法。

e、完全兼容mysql协议

由于MySQL特殊的插件式存储引擎架构，server层负责SQL解析、SQL优化、数据库对象(视图、存储过程等）管理；存储引擎层负责数据存储、索引支持、事务、buffer等，两者之间通过约定好的handler接口进行交互。SQL解析、优化与执行交给server层处理，几乎支持执行任意类型SQL访问。

4、Spider的劣势

a、spider的表本身不支持查询缓存和全文索引，不过可以将全文索引添加在后端数据库中；

b、如果采用物理备份，spider无法备份后端的数据，因为数据本身是存放在后端。可以对后端的mysql一一做物理备份

c、spider本身是单点，需要自己做容灾机器，比如通过VIP的方式

d、多了一层网络，性能上会有一些损耗，尤其是跨分区、跨表查询性能会差一些

5、Tspider介绍

腾讯互娱DBA团队在spider 3.1的基础上进行深入优化和定制开发，形成了Tspider，极大地提高了spider性能、稳定性和兼容性，在性能上比spider至少提升30%，目前Tspider已经发展到了Tspider 1.9版本，Tspider经过了腾讯游戏海量访问以及高数据安全性的考验，整体解决方案已经非常成熟，目前财付通也有部分服务器使用了互娱的Tspider，腾讯互娱DBA团队修复的部分优化点如下：

二、Spider的使用场景解析

1、垂直分表的场景和解析

a、垂直分表场景图

b、垂直分表场景解析

从上图可以看出，spider后面接4台DB server，可以将不通功能的表分布到后端不通的DB server中，比如user_info的表专门存放在HostA中，user_msg表存放在了HostB中，user_detail表存放在了HostC中，user_log表存放在了HostD中。在图中的红色部分，当我们执行红色部分的SQL的时候，spider会通过user_info表的映射关系以及HostA的IP映射关系，将查询user_info表的请求都转发到HostA上，HostA查询完成后再将结果发给spider服务器，spider再转发给客户端。

2、采用水平分表的场景

a、水平分表场景图

b、水平分表场景解析

spider支持多种水平分表的模式，目前支持hash分表（hash）、范围分表（range）、列表分表（list），我这里用range来说明水平分表的工作原理。从上图中可以看出spider对user_info表针对id进行了分区，将0~100000的记录存储在了HostA，100000~200000的记录存储在了HostB，200000~300000的记录存储在了HostC，300000~400000的记录存储在了HostD。当用户访问user_info的某条或者多条记录的时候，spider会根据分区的情况，对相关的记录落在某台或者多台DB server上，再进行转发。比如select * from user_info where id=1这个SQL，spider在收到这个请求后，会跟进分区情况选择对应的DB server进行转发。这里会将该请求转发到HostA中。HostA处理完成后，再将结果返回给spider server，spider再将结果转发给发起请求的客户端。

三、Spider引擎实战

（一）、spider的安装部署

从spider 10.0.0.4版本开始，spider引擎就集成到了MariaDB中，集成后安装就非常的简单，安装步骤如下：

1、安装mariaDB到spider server以及后端多台DB server上；

安装方法非常简单，这里不在赘述，具体可以参考：

2、安装spider引擎到spider server上（后端的DB server不需要安装spider引擎）

mysql -uroot -p < install_spider.sql

或者登录mysql后执行

source /path/install_spider.sql

备注：install_spider.sql在share目录下面

这个命令所做的事情如下：

创建spider相关的系统表

spider_link_failed_log

spider_link_mon_servers

spider_tables

spider_xa

spider_xa_failed_log

spider_xa_member

创建spider相关的表结构

加载spider引擎

3、检查spider引擎是否安装成功

如果出现上图所示的结果就说明已经支持了spider引擎了

（二）、spider的使用实战

备注：本实践环境基于tspider-1.8.5环境全部验证通过

1、spider实战拓扑图

在实战部分，我使用了2台DB server，部署图如下：

2、实战前准备

a、创建spider server访问后端DB server的权限（后面配置中需要用到）

grant all on *.* tospider_db_all@'10.128.128.91' identified by 'tospider_db_all';

b、创建spider后端DB server的配置

可以通过执行如下SQL的形式直接创建

create server backend1 foreign data wrapper mysql options (host '10.128.128.60', database 'test', user 'spider_db_all', password 'spider_db_all', port 3306);

create server backend2 foreign data wrapper mysql options (host '10.128.128.88', database 'test', user 'spider_db_all', password 'spider_db_all', port 3306);

也可以通过直接给mysql.servers表中直接插入相关的记录，不过后面执行flush hosts才能生效

insert into mysql.servers(Server_name,Host,Db,Username,Password,Port,Socket,Wrapper,Owner)values ('backend1','10.128.128.60','test','spider_db_all','spider_db_all',3306,'','mysql','');

insert into mysql.servers(Server_name,Host,Db,Username,Password,Port,Socket,Wrapper,Owner)values ('backend2','10.128.128.88','test','spider_db_all','spider_db_all',3306,'','mysql','');

创建完成后可以直接查询mysql.servers表，确认是否添加成功，如下截图所示：

b、创建基础测试表

在后端两台DB server上创建基础测试表（在60和88上执行）

create table test_spider (

id int,

username varchar(20),

address varchar(128),

primary key (id),

key (username)

) engine=InnoDB default charset=utf8 comment 'spider test base table';

3、spider引擎实战

a、建立垂直表（远程表进行测试）

create table test_spider (

id int,

username varchar(20),

address varchar(128),

primary key (id),

key (username)

) ENGINE=SPIDER DEFAULT CHARSET=utf8 COMMENT='server "backend1"';

创建之后，执行对应增删改查，看看是否对应的操作都发生在了backend1对应的DB server上？

测试完成后，删除掉spider 服务器上的test_spider表，你会发现drop掉spider上的表，不会导致后端DB server上的表被删除。

b、建立hash分区表

create table test_spider (

id int,

username varchar(20),

address varchar(128),

primary key (id),

key (username)

) ENGINE=SPIDER DEFAULT CHARSET=utf8 COMMENT='wrapper "mysql", table "test_spider"'

PARTITION BY HASH (id)

( PARTITION pt1 COMMENT = 'srv "backend1"',

PARTITION pt2 COMMENT = 'srv "backend2"') ;

创建之后，执行对应增删改查，看看是否对应的操作都发生在了backend1和backend2对应的DB server上？

测试完成后，删除掉spider 服务器上的test_spider表，你会发现drop掉spider上的表，不会导致后端DB server上的表被删除。

c、建立range分区表

create table test_spider (

id int,

username varchar(20),

address varchar(128),

primary key (id),

key (username)

) ENGINE=SPIDER DEFAULT CHARSET=utf8 COMMENT='wrapper "mysql", table "test_spider"'

PARTITION BY range columns (id)

( PARTITION pt1 values less than (100000) COMMENT = 'srv "backend1"',

PARTITION pt2 values less than (200000) COMMENT = 'srv "backend2"') ;

创建之后，执行对应增删改查，看看是否对应的操作都发生在了backend1和backend2对应的DB server上？

测试完成后，删除掉spider 服务器上的test_spider表，你会发现drop掉spider上的表，不会导致后端DB server上的表被删除。

d、建立list分区表测试

create table test_spider (

id int,

username varchar(20),

address varchar(128),

primary key (id),

key (username)

) ENGINE=SPIDER DEFAULT CHARSET=utf8 COMMENT='wrapper "mysql", table "test_spider"'

PARTITION BY list columns (id)

( PARTITION pt1 values in (1,3,5,7,9) COMMENT = 'srv "backend1"',

PARTITION pt2 values in (2,4,6,8,10) COMMENT = 'srv "backend2"') ;

创建之后，执行对应增删改查，看看是否对应的操作都发生在了backend1和backend2对应的DB server上？

测试完成后，删除掉spider 服务器上的test_spider表，你会发现drop掉spider上的表，不会导致后端DB server上的表被删除。