Memcached初试-panzt-ChinaUnix博客

疯狂编程-每天学习一点点-每天进步一点点-似水无痕panzt.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

PANZT

博客访问： 1305506
博文数量： 315
博客积分： 10397
博客等级：上将
技术积分： 3731
用户组：普通用户
注册时间： 2007-03-07 21:21

文章分类

全部博文（315）

Google（1）
Mac OS（2）
Nginx（1）
libGDX（1）
Android（1）
Netbean（1）
Magento（11）
Web架构/负载/性（8）
Cairngorm（2）
DIV+CSS（2）
Python（1）
AMFPHP（1）
Drupal（2）
Flex Builder（3）
Zend Framework（14）
XML+XSL（1）
Flex（31）
Mass of Manage（3）
ERP（1）
FleaPHP（6）
Apache（16）
mysql（14）
Server&&Hardware（7）

SearchTech（0）
Flash（7）
Smarty（2）
Pear（5）
PHP-Class（0）
PHP（43）
Web（17）
EIP（3）
Fortigate（2）
Linux（44）
Windows&&AD（13）
记事薄（43）
未分配的博文（6）

文章存档

2015年（10）

2014年（3）

2013年（2）

2012年（8）

2011年（8）

2010年（29）

2009年（59）

2008年（77）

2007年（119）

我的朋友

最近访客

推荐博文

Memcached初试

分类：

2010-11-11 16:05:39

【Memcached初试】

[ 接口介绍 ]
服务器端和客户端都安装配置好了，现在我们就来测试以下我们的成果。Memcached客户端包含两组接口，一组是面向过程的接口，一组是面向对象的接口，具体可以参考PHP手册 "LXXV. Memcached Functions" 这章。我们为了简单方便，就使用面向对象的方式，也便于维护和编写代码。Memcached面向对象的常用接口包括：

Memcached::connect -- 打开一个到Memcached的连接
Memcached::pconnect -- 打开一个到Memcached的长连接
Memcached::close -- 关闭一个Memcached的连接
Memcached::set -- 保存数据到Memcached服务器上
Memcached::get -- 提取一个保存在Memcached服务器上的数据
Memcached::replace -- 替换一个已经存在Memcached服务器上的项目（功能类似Memcached::set）
Memcached::delete -- 从Memcached服务器上删除一个保存的项目
Memcached::flush -- 刷新所有Memcached服务器上保存的项目（类似于删除所有的保存的项目）
Memcached::getStats -- 获取当前Memcached服务器运行的状态

[ 测试代码 ]
现在我们开始一段测试代码：

//连接
$mem = new Memcached;
$mem->connect(" ", 12000);

//保存数据
$mem->set( 'key1', ' This is first value', 0, 60);
$val = $mem->get('key1 ');
echo "Get key1 value: " . $val ."
";

//替换数据
$mem->replace( 'key1', ' This is replace value', 0, 60);
$val = $mem->get('key1 ');
echo "Get key1 value: " . $val . "
" ;

//保存数组
$arr = array('aaa ', 'bbb' , 'ccc', 'ddd');
$mem ->set('key2', $arr, 0, 60);
$val2 = $mem->get('key2 ');
echo "Get key2 value: ";
print_r($val2 );
echo "
" ;

//删除数据
$mem-> delete('key1');
$val = $mem->get( 'key1');
echo "Get key1 value: " . $val . "
";

//清除所有数据
$mem ->flush();
$val2 = $mem->get('key2 ');
echo "Get key2 value: ";
print_r($val2 );
echo "
" ;

//关闭连接
$mem-> close();
?>

如果正常的话，浏览器将输出：
Get key1 value: This is first value
Get key1 value: This is replace value
Get key2 value: Array ( [0] => aaa [1] => bbb [2] => ccc [3] => ddd )
Get key1 value:
Get key2 value:

基本说明我们的Memcached安装成功，我们再来分析以下上面的这段程序。

[ 程序分析 ]

初始化一个Memcached的对象：
$mem = new Memcached;

连接到我们的Memcached服务器端，第一个参数是服务器的IP地址，也可以是主机名，第二个参数是Memcached的开放的端口：
$mem->connect("" , 12000);

保存一个数据到Memcached服务器上，第一个参数是数据的key，用来定位一个数据，第二个参数是需要保存的数据内容，这里是一个字符串，第三个参数是一个标记，一般设置为0或者MEMCACHE_COMPRESSED就行了，第四个参数是数据的有效期，就是说数据在这个时间内是有效的，如果超过这个时间，那么会被Memcached服务器端清除掉这个数据，单位是秒，如果设置为0，则是永远有效，我们这里设置了60，就是一分钟有效时间：
$mem->set('key1', 'This is first value', 0, 60);

从Memcached服务器端获取一条数据，它只有一个参数，就是需要获取数据的key，我们这里是上一步设置的key1，现在获取这个数据后输出输出：
$val = $mem->get('key1');
echo "Get key1 value: " . $val;

现在是使用replace方法来替换掉上面key1的值，replace方法的参数跟set是一样的，不过第一个参数key1是必须是要替换数据内容的key，最后输出了：
$mem->replace('key1', 'This is replace value' , 0, 60);
$val = $mem->get('key1');
echo " Get key1 value: " . $val;

同样的，Memcached也是可以保存数组的，下面是在Memcached上面保存了一个数组，然后获取回来并输出
$arr = array('aaa', 'bbb', 'ccc' , 'ddd');
$mem->set('key2', $arr, 0, 60 );
$val2 = $mem->get('key2');
print_r($val2);

现在删除一个数据，使用delte接口，参数就是一个key，然后就能够把Memcached服务器这个key的数据删除，最后输出的时候没有结果
$mem->delete('key1');
$val = $ mem->get('key1');
echo "Get key1 value: " . $val . "
";

最后我们把所有的保存在Memcached服务器上的数据都清除，会发现数据都没有了，最后输出key2的数据为空，最后关闭连接
$mem->flush();
$val2 = $mem->get( 'key2');
echo "Get key2 value: ";
print_r($val2);
echo "
";

【Memcached协议分析】

如果你不喜欢 php_memcache.dll 扩展或者服务器器目前不支持这个扩展，那么就可以考虑自己构建，需要构建Memcahe的客户端，要先了解Memcached协议的交互，这样才能开发自己的客户端，我这里就简单的分析以下Memcached的协议。
（更详细的协议内容请在Memcached服务器端的源码的 doc/protocol.txt 文件中，本文基本来源于此）

Memcached既支持TCP协议，也支持UDP协议，不过我们这里是以TCP协议的协议作为主要考虑对象，想了解UDP协议的过程，请参考 doc/protocol.txt 文件。

[ 错误指令]
Memcached的协议的错误部分主要是三个错误提示之提示指令：
普通错误信息，比如指令错误之类的
ERROR\r\n

客户端错误
CLIENT_ERROR <错误信息>\r\n

服务器端错误
SERVER_ERROR <错误信息>\r\n

[ 数据保存指令]
数据保存是基本的功能，就是客户端通过命令把数据返回过来，服务器端接收后进行处理。
指令格式：
<命令> <键> <标记> <有效期> <数据长度>\r\n

<命令> - command name
主要是三个储存数据的三个命令， set, add, replace
set 命令是保存一个叫做key的数据到服务器上
add 命令是添加一个数据到服务器，但是服务器必须这个key是不存在的，能够保证数据不会被覆盖
replace 命令是替换一个已经存在的数据，如果数据不存在，就是类似set功能

<键> - key
就是保存在服务器上唯一的一个表示符，必须是跟其他的key不冲突，否则会覆盖掉原来的数据，这个key是为了能够准确的存取一个数据项目

<标记> - flag
标记是一个16位的无符号整形数据，用来设置服务器端跟客户端一些交互的操作

<有效期> - expiration time
是数据在服务器上的有效期限，如果是0，则数据永远有效，单位是秒，Memcached服务器端会把一个数据的有效期设置为当前Unix时间+设置的有效时间

<数据长度> - bytes
数据的长度，block data 块数据的长度，一般在这个个长度结束以后下一行跟着block data数据内容，发送完数据以后，客户端一般等待服务器端的返回，服务器端的返回：

数据保存成功
STORED\r\n

数据保存失败，一般是因为服务器端这个数据key已经存在了
NOT_STORED\r\n

[ 数据提取指令]
从服务器端提取数据主要是使用get指令，格式是：
get <键>*\r\n

<键>* - key
key是是一个不为空的字符串组合，发送这个指令以后，等待服务器的返回。如果服务器端没有任何数据，则是返回：
END\r\n

证明没有不存在这个key，没有任何数据，如果存在数据，则返回指定格式：
VALUE <键> <标记> <数据长度>\r\n
<数据块> \r\n

返回的数据是以VALUE开始的，后面跟着key和flags，以及数据长度，第二行跟着数据块。

<键> -key
是发送过来指令的key内容

<标记> - flags
是调用set指令保存数据时候的flags标记

<数据长度> - bytes
是保存数据时候定位的长度

<数据块> - data block
数据长度下一行就是提取的数据块内容

[ 数据删除指令]
数据删除指令也是比较简单的，使用get指令，格式是：
delete <键> <超时时间>\r\n

<键> - key
key是你希望在服务器上删除数据的key键

<超时时间> - timeout
按照秒为单位，这个是个可选项，如果你没有指定这个值，那么服务器上key数据将马上被删除，如果设置了这个值，那么数据将在超时时间后把数据清除，该项缺省值是0，就是马上被删除

删除数据后，服务器端会返回：
DELETED\r\n
删除数据成功
NOT_FOUND\r\n
这个key没有在服务器上找到

如果要删除所有服务器上的数据，可以使用flash_all指令，格式：
flush_all\r\n

这个指令执行后，服务器上所有缓存的数据都被删除，并且返回：
OK\r\n

这个指令一般不要轻易使，除非你却是想把所有数据都干掉，删除完以后可以无法恢复的。

[其他指令]
如果想了解当前Memcached服务器的状态和版本等信息，可以使用状态查询指令和版本查询指令。

如果想了解当前所有Memcached服务器运行的状态信息，可以使用stats指令，格式
stats\r\n
服务器将返回每行按照 STAT 开始的状态信息，包括20行，20项左右的信息，包括守护进程的pid、版本、保存的项目数量、内存占用、最大内存限制等等信息。

如果只是想获取部分项目的信息，可以指定参数，格式：
stats <参数>\r\n
这个指令将只返回指定参数的项目状态信息。

如果只是想单独了解当前版本信息，可以使用version指令，格式：
version\r\n
将返回以 VERSION 开头的版本信息

如果想结束当前连接，使用quit指令，格式：
quit\r\n

将断开当前连接

另外还有其他指令，包括incr, decr 等，我也不太了解作用，就不做介绍了，如果感兴趣，可以自己去研究。

【Memcached在中型网站的使用】

使用Memcached的网站一般流量都是比较大的，为了缓解数据库的压力，让Memcached作为一个缓存区域，把部分信息保存在内存中，在前端能够迅速的进行存取。那么一般的焦点就是集中在如何分担数据库压力和进行分布式，毕竟单台Memcached的内存容量的有限的。我这里简单提出我的个人看法，未经实践，权当参考。

[ 分布式应用]
Memcached本来支持分布式，我们客户端稍加改造，更好的支持。我们的key可以适当进行有规律的封装，比如以user为主的网站来说，每个用户都有User ID，那么可以按照固定的ID来进行提取和存取，比如1开头的用户保存在第一台Memcached服务器上，以2开头的用户的数据保存在第二胎Mecache服务器上，存取数据都先按照User ID来进行相应的转换和存取。

但是这个有缺点，就是需要对User ID进行判断，如果业务不一致，或者其他类型的应用，可能不是那么合适，那么可以根据自己的实际业务来进行考虑，或者去想更合适的方法。

[ 减轻数据库压力]
这个算是比较重要的，所有的数据基本上都是保存在数据库当中的，每次频繁的存取数据库，导致数据库性能极具下降，无法同时服务更多的用户，比如MySQL，特别频繁的锁表，那么让Memcached来分担数据库的压力吧。我们需要一种改动比较小，并且能够不会大规模改变前端的方式来进行改变目前的架构。

我考虑的一种简单方法：
后端的数据库操作模块，把所有的Select操作提取出来（update/delete/insert不管），然后把对应的SQL进行相应的hash算法计算得出一个hash数据key（比如MD5或者SHA），然后把这个key去Memcached中查找数据，如果这个数据不存在，说明还没写入到缓存中，那么从数据库把数据提取出来，一个是数组类格式，然后把数据在set到Memcached中，key就是这个SQL的hash值，然后相应的设置一个失效时间，比如一个小时，那么一个小时中的数据都是从缓存中提取的，有效减少数据库的压力。

缺点是数据不实时，当数据做了修改以后，无法实时到前端显示，并且还有可能对内存占用比较大，毕竟每次select出来的数据数量可能比较巨大，这个是需要考虑的因素。

上面只是我两点没有经过深思熟虑的简单想法，也许有用，那就最好了。

【Memcached的安全】

我们上面的Memcached服务器端都是直接通过客户端连接后直接操作，没有任何的验证过程，这样如果服务器是直接暴露在互联网上的话是比较危险，轻则数据泄露被其他无关人员查看，重则服务器被入侵，因为Mecache是以root权限运行的，况且里面可能存在一些我们未知的bug或者是缓冲区溢出的情况，这些都是我们未知的，所以危险性是可以预见的。

为了安全起见，我做两点建议，能够稍微的防止黑客的入侵或者数据的泄露。

[ 内网访问]
最好把两台服务器之间的访问是内网形态的，一般是Web服务器跟Memcached服务器之间。普遍的服务器都是有两块网卡，一块指向互联网，一块指向内网，那么就让Web服务器通过内网的网卡来访问Memcached服务器，我们Memcached的服务器上启动的时候就监听内网的IP地址和端口，内网间的访问能够有效阻止其他非法的访问。

# memcached -d -m 1024 -u root -l -p 11211 -c 1024 -P /tmp/memcached.pid

Memcached服务器端设置监听通过内网的192.168.0.200的ip的11211端口，占用1024MB内存，并且允许最大1024个并发连接

[ 设置防火墙]
防火墙是简单有效的方式，如果却是两台服务器都是挂在网的，并且需要通过外网IP来访问Memcached的话，那么可以考虑使用防火墙或者代理程序来过滤非法访问。
一般我们在Linux下可以使用iptables或者FreeBSD下的ipfw来指定一些规则防止一些非法的访问，比如我们可以设置只允许我们的Web服务器来访问我们Memcached服务器，同时阻止其他的访问。

# iptables -F
# iptables -P INPUT DROP
# iptables -A INPUT -p tcp -s --dport 11211 -j ACCEPT
# iptables -A INPUT -p udp -s --dport 11211 -j ACCEPT

上面的iptables规则就是只允许192.168.0.2这台Web服务器对Memcached服务器的访问，能够有效的阻止一些非法访问，相应的也可以增加一些其他的规则来加强安全性，这个可以根据自己的需要来做。

【Memcached的扩展性】

Memcached算是比较简洁高效的程序，Memcached 1.2.0 的源代码大小才139K，在Windows平台上是不可想象的，但是在开源世界来说，这是比较正常合理的。
Memcached目前都只是比较简单的功能，简单的数据存取功能，我个人希望如果有识之士，能够在下面两方面进行扩展。

1. 日志功能
目前Memcached没有日志功能，只有一些命令在服务器端进行回显，这样是很不利于对一个服务器的稳定性和负载等等进行监控的，最好能够相应的加上日志的等功能，便于监控。

2. 存储结构
目前的数据形式就是: key => data 的形式，特别单一，只能够存储单一的一维数据，如果能够扩展的话，变成类似数据库的格式，能够存储二维数据，那样会让可以用性更强，使用面更广，当然相应的可能代码效率和存取效率更差一些。

3. 同步功能
数据同步是个比较重要的技术，因为谁都不能保证一台服务器是持久正常的运行的，如果能够具有类似MySQL的 Master/Slave 的功能，那么将使得Memcached的数据更加稳定，那么相应的就可以考虑存储持久一点的数据，并且不用害怕Memcached的down掉，因为有同步的备份服务器，这个问题就不是问题了。

以上三点只是个人拙见，有识之士和技术高手可以考虑。

【结束语】

我上面的内容都只是自己安装和使用的一些想法，不能保证绝对正确，只是给需要的人一个参考，一个推广Memcached的文章，希望更多的人能够认识和了解这个技术，并且为自己所用。

我花费了整整一个晚上的时间洋洋洒洒的写了这么长，无非是对于这项开源技术的热爱，我想开源世界能够繁荣起来，就是源于大家的热爱并且愿意做出贡献，开源世界才这么精彩。

希望本文能够给需要的人一些帮助，希望不会误导他们，呵呵。

附加：（我操作Memcached相应对应上面文章内容的图片）

[ 启动Memcached]

[ Memcached的PHP测试代码]

[测试代码执行效果]

[ 通过Telnet连接到Memcached ]

[ 基本的Memcached的数据存取协议交互]

[ Memcached状态信息协议交互]

阅读(4577) | 评论(0) | 转发(0) |

上一篇：CentOS 5.4下的Memcache安装(Linux+Nginx+PHP+Memcached)

下一篇：MYSQL替换字符串

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6