大镇的博客

首页　| 　博文目录　| 　关于我

大镇

博客访问： 2314151
博文数量： 297
博客积分： 0
博客等级：民兵
技术积分： 2205
用户组：普通用户
注册时间： 2014-03-31 14:30

个人简介

自己慢慢积累。

文章分类

全部博文（297）

appium（1）
flask（1）
docker（0）
js（1）
docker（4）
excel（1）
Bootstrap（3）
Django（21）
性能测试（1）
移动端测试（3）
python（68）

pytest（1）

进程的使用（2）

数据分析（2）

tkinter（3）
selenium（19）
分布式数据库（1）
WINDOWS（5）
TokuDB（7）
TokuDB（3）
安全测试（4）
JMeter（10）
oracle（2）
goldengate（10）
测试理论（2）
mysql（71）

数据恢复（2）

mysql学习（3）

MYSQL优化（14）

mysql管理（10）

高可用（4）

数据导出（3）

性能测试（2）

表分区（4）

触发器（0）

一机多Mysql（3）

查询技巧（7）

主从互备（9）
linux（59）

分布式存储（1）

定时任务（2）

环境相关（4）

FTP（1）

linux管理（4）

keepalived（3）

awk（3）

磁盘性能（1）

shell编程（25）

虚拟机（2）

磁盘挂载（11）
未分配的博文（0）

转自云栖社区

https://yq.aliyun.com/articles/79535?spm=5176.100239.blogcont213.14.RGVlzr

TokuDB如何用？腾讯这么做！

2017-05-02 13:40:00 浏览92 评论0

mysql innodb 配置 Cache 测试运营 tokudb 压力测试存储

摘要：本文根据第55期线上分享整理而成，文末有彩蛋哟~ 前言大家好，我是林水彬，来自腾讯互动娱乐事业群的DBA。很高兴今天能有机会在这里跟大家一起交流讨论TokuDB在业务中的一些相关实践。本次主要有3个议题想和大家交流讨论下：背景压力测试运营经验 TokuDB的背景让我们从使用TokuDB的背景说起。

本文根据第55期线上分享整理而成，文末有彩蛋哟~

前言

大家好，我是林水彬，来自腾讯互动娱乐事业群的DBA。很高兴今天能有机会在这里跟大家一起交流讨论TokuDB在业务中的一些相关实践。

本次主要有3个议题想和大家交流讨论下：

背景
压力测试
运营经验

TokuDB的背景

让我们从使用TokuDB的背景说起。

这幅图层现了当前我们大部分的游戏架构，今天要讨论的角色在左下角—logdb，logdb(又叫tlog)，顾名思义，存储的是玩家的一些流水日志，譬如，登陆/登出；购买的道具记录等。

非技术的现状：

随着游戏的运营策划，拉新留存，不断滚服，不同区服在线不均，导致资源浪费；
策划希望保留更多的数据，X业务单区甚至能达到 2T。

技术的现状：

采用InnoDB，一般是游戏大区：Tlog = 1:1；存储的硬件成本高；
采用MyISAM，虽然能节省一半空间，但无法在线加字段，而加字段的变更又是占游戏日常变更的大块头。

TokuDB:InnoDB = 1:10

TokuDB:MyISAM = 1:5

MyISMA:InnoDB = 1:2

这是一组经验数据。

2015年上半年，当时部门正在搞成本优化，借着这把火，我们发起了一个项目，叫：端游Tlog成本优化。以项目的方式，以TokuDB为技术，以业务的诉求为基础，按KPI驱动，逐步建设，逐步迭代，快速落地。

目前接入TokuDB的业务20+，实例200+。

这幅图是我们最开始推动接入TokuDB的5个业务，节省机器数 150台，按照tlog机型每个月运营成本980/月，这5个业务每个月也可以节省15万。也许这是技术变现的另一层意思。

接下来我们正式介绍下TokuDB。

TokuDB作为MySQL的一个存储引擎，业务侧不需要修改任何代码，开发可以像使用InnoDB一样选择TokuDB。它有如下几个优点：

上线现网前我们对TokuDB进行了一些调研，主要包括：

高压缩比
查询
更新
业务查询
业务入库

第4、5是我们基于tlog业务个性化的考虑出发的。

我们先看下TokuDB为人称道的高压缩特性。

这是我们从现网来的一组压缩数据。

TokuDB之所以比InnoDB有较高的压缩优势，可能原因有：

TokuDB默认块大小为4M，更适合压缩。
InnoDB需要将压缩后的数据pad到固定大小的padding 空间里，这会降低所能达到的压缩效果，而TokuDB是unpadded。
InnoDB可能存在碎片，而TokuDB没有这个问题。

TokuDB相关压力测试

关于压力测试，我们使用的工具是自研的test_server：

查询的测试SQL：SELECT id FROM test.big_tb WHERE id= ?

原地更新的测试SQL：update test.big_tb set col1=col1+1 whereid = ?

非原地更新的测试SQL：update test.sml_tb set col13 =substr(sha1(rand()), 1, ceil(rand()*8)) where id = ?

首先是select。

MySQL配置

innodb_buffer_pool_size=15G

innodb_flush_log_at_trx_commit=0

sync_binlog=0

row_format=lz_ma(TokuDB)

tokudb_cache_size=15G

全cache

row 2000000 innodb 2.4G tokudb 20M

非全cache

row 40000000 innodb 48G tokudb 754M

结论：

全cache下TokuDB是InnoDB的2/3
非全cache同等数据用tokudb后只有754M，所以tokudb 内存能缓存大部分数据下，TokuDB几乎是InnoDB的10倍

其次是更新。

MySQL配置

innodb_buffer_pool_size=15G

innodb_flush_log_at_trx_commit=0

sync_binlog=0

row_format=lz_ma(TokuDB)

tokudb_cache_size=15G

全cache

row 2000000 innodb 2.4G tokudb 20M

非全cache

row 40000000 innodb 48G tokudb 754M

结论：

全cache下无论原地更新或非原地更新对于TokuDB的表现均无太大差别
全cache下原地更新TokuDB是InnoDB的1/2,非原地更新TokuDB是InnoDB的2/3
非全cache同等数据用tokudb后只有754M，所以tokudb 内存能缓存大部分数据下，无论原地更新或非原地更新，InnoDB是TokuDB的1/5

同时，我们也回放了现网tlog的查询模式。

现网回放的Top 7 SQL属于范围查询，而范围查询 TokuDB的表现要优于InnoDB。

根据前面的压力测试环节，可以看出，TokuDB优势在于压缩和范围查询，点查询不是他的优势所在。所以，稍微总结下，建议TokuDB的应用场景如下：

TokuDB运营经验

说完压测，接下来我们讨论下踩坑的正确姿势。

第1个坑。

来自TMySQL用户，包括很多开发和GCS系统，都习惯mysql –u$USER –p$PASSWD 来执行，这条命令在MySQL 5.6会有个warning告警：

Warning: Using a password on the command line interface can be insecure

单据或者脚本解析到这个warning，则全部失败。

所以，为了向前兼容，我们在源码层面将这个warn关闭。

看第2个坑。

一般MySQL的升级方法包括：

导入导出
做一个slave
原地升级

根据数据量大小，如果100G内的，我们一般选择原地升级。

某天在某个高星级业务上业务运维发现TokuDB的加字段很慢。

TokuDB无法在线加字段的条件：

原地升级
表含有数据
表含有时间字段

TokuDB无法在线加字段的原因：

MySQL 5.6.4在Server层新增三种时间类型MYSQL_TYPE_TIME2，MYSQL_TYPE_DATETIME2，MYSQL_TYPE_TIMESTAMP2，并在InnoDB层以二进制的格式存储，用这种方式来实现时间类型支持小数精度并优化存储节省空间。如果直接使用加字段操作，alter table t1 add c1 int。

对MySQL 5.6中，通常情形下加字段的隐式行为是走的online ddl，即ALGORITHM=INPLACE。如若t1满足上述3个条件，该SQL则隐式走ALGORITHM=COPY，即非在线加字段的逻辑。因此，在系统默认行为下，通过原地升级过来的旧版本MySQL时间类型会妨碍后续的online ddl行为。

修复的方式有2个：

alter table force，这种方式需要拷贝数据，成本太高。
avoid_temporal_upgrade 把这个参数打开即可，很赞，建议使用这种方式。

接下来看第3个坑。

某天有开发投诉，数据入库延迟严重，导致统计任务失败，重跑成本极高。

TokuDB官方宣称Load DATA比InnoDB强；并且我们在预研阶段也验证过的确如此，BUT WHY ？？

查阅文档发现，原来是使用的姿势不对，Load DATA带不带local关键字区别很大。

有无local走的协议不同，有local，则是通过client读取后发送给server；无local，便是server直接读取。

下面看第4个坑。

现网TokuDB的部署策略是1:2或1:4个大区共用1个实例，正如这幅图所展示的：

淘宝的MySQL内核月报提到TokuDB 分区表文件数目计算公式：分区数目 * (1 + 1 + 索引数目)，这么一算，fd不够用也就有理有据了，因为fd是进程级别的，所以我们只要进行如下调整即可。

这是我们现网TokuDB实例上架的参数。

这个坑是业务运维的兄弟发现的，他们在查询时DB经常报：MySQL GONE AWAY。

接下来是最后一个坑。

数据安全是DBA的生命线，随着运营数据的与日俱增，逻辑备份压力越来越大。我们对比了业界的2种方案：

为了便于内部系统集成，我们采用阿里的方案。

TokuDB物理备份的步骤：

连接mysql，设置SET TOKUDB_CHECKPOINT_LOCK=ON;
加只读锁FLUSH TABLES WITH READ LOCK;
获取binlog位置，
拷贝tokudb的redolog和一些元数据文件（tokudb.****）
释放只读锁UNLOCK TABLES;
拷贝tokudb的数据文件和表结构
释放checkpoint锁，SET TOKUDB_CHECKPOINT_LOCK=OFF;

但我们发现，TokuDB把所有的数据文件的路径都写死了，这样不同实例跨端口的恢复就不会报错。

tokuftdump解析tokudb.directory：

从解析的内容可以看出，每个记录都是一个key，一个value，key就是对应的表名，value就是数据文件的路径，tokudb把所有的数据文件的路径写死，这样的话恢复到不同路径的话当然就会报错。

我们TMySQL 2.x对这个“bug”做了修复，使directory文件中只存相对路径，然后和数据文件的路径拼出完整的路径。

修复解析的内容如下：

至此备份的坑也就解决了。

Q&A

Q1： Toku的缺点主要有哪些，因为目前innondb还是大量在使用，能否指点一二?

A1：缺点可以从压力测试的数据看下，主要是点查询比InnoDB差。

Q2：Tokudb的range query比innodb 好？还有原因是cache 命中高吗？

A2：从我们测试来看，TokuDB的范围查询比InnoDB要好；TokuDB能缓存大部分数据可能是一个原因；不过当我们把tokudb的内存参数调得比数据要小一点的时候，TokuDB的范围查询仍然比InnoDB要高一点。

Q3：阿里备份与percona备份有没详细一点的对比?

A3：第一个是官方提供的方案——https://www.percona.com/blog/2015/02/05/tokudb-hot-backup-now-mysql-plugin/。简单来说这个方案是做了一个插件，加载了一个so，拦截所有有关于文件的系统调用，然后一边复制一边将改动同时应用到拷贝上去。

第二个是阿里提供的方案——，这个方案听起来相对简单，只要加锁然后拷贝文件就可以了。

Q4：方便的话请介绍一下硬件的配置，cpu (压缩算法对cpu 的要求），磁盘方面参数。

A4：我们tlog机型刚刚在背景那块稍微提了下，配置不是很高。

Q5：在这配置下，生产最高的QPS,TPS是多少，CPU user是多少？

A5：目前我们TokuDB大部分是在Tlog业务应用，而Tlog的查询不会太高，主要是周边系统拉取的，所以QPS这个指标我们之前不是很关注；这个之前我们采集的某高星级业务整点高峰的性能数据。

作者介绍林水彬

目前就职于腾讯，主要工作包括MYSQL、Hadoop以及自动化平台建设；
TPUB版主，CSDN社区技术专家。

本文来自云栖社区合作伙伴"DBAplus"，原文发布时间：2016-05-06

如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件至：yqgroup@service.aliyun.com 进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容。

阅读(1093) | 评论(0) | 转发(0) |

上一篇：python安装pandas

下一篇：TokuDB · 让Hot Backup更完美

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

转自 云栖社区

TokuDB如何用？腾讯这么做！

转自云栖社区