深入理解Memcache原理-kongkong011-ChinaUnix博客

陈皓月

首页　| 　博文目录　| 　关于我

kongkong011

博客访问： 2047705
博文数量： 433
博客积分： 918
博客等级：准尉
技术积分： 3218
用户组：普通用户
注册时间： 2012-02-24 18:21

个人简介

你是不是暗恋我，那就给我发个消息呀，让我知道o(∩∩)o

文章分类

全部博文（433）

git（1）
规范（2）
docker（4）
插件（3）
加密（1）
虚拟化（3）
html（2）
python（5）
openssl（5）
shell（10）
sphinx（3）
yaf（6）
windows（1）
http（4）
nginx（10）
redis（3）
apache（5）
ubuntu（98）
PHP（66）
Js（2）
Mysql（50）
C语言（11）
硬件（3）
gdb（1）
fedora（4）
CentOS（85）
C语言mysql（2）
socket（3）
gtk+（16）
未分配的博文（24）

推荐博文

3.基于libevent的事件处理

libevent是个程序库，它将Linux的epoll、BSD类操作系统的kqueue等事件处理功能封装成统一的接口。即使对服务器的连接数增加，也能发挥O(1)的性能。

memcached使用这个libevent库，因此能在、BSD、Solaris等上发挥其高性能。

参考：

libevent:
The C10K Problem:

4.memcache使用实例：

			[php] view plaincopy
			
			$mc = new Memcache();  
		
			$mc->connect('127.0.0.1', 11211);  
		
			$uid = (int)$_GET['uid'];  
		
			$sql = "select * from users where uid='uid' ";  
		
			$key = md5($sql);  
		
			if(!($data = $mc->get($key))) {  
		
			    $conn = mysql_connect('localhost', 'test', 'test');  
		
			    mysql_select_db('test');  
		
			    $result = mysql_fetch_object($result);  
		
			    while($row = mysql_fetch_object($result)) {  
		
			          $data[] = $row;  
		
			    }  
		
			    $mc->add($key, $datas);  
		
			}  
		
			var_dump($datas);  
		
			?>

5.memcache如何支持高并发(此处还需深入研究)

memcache使用多路复用I/O模型，如（epoll, select等），传统I/O中，系统可能会因为某个用户连接还没做好I/O准备而一直等待，知道这个连接做好I/O准备。这时如果有其他用户连接到服务器，很可能会因为系统阻塞而得不到响应。

而多路复用I/O是一种消息通知模式，用户连接做好I/O准备后，系统会通知我们这个连接可以进行I/O操作，这样就不会阻塞在某个用户连接。因此，memcache才能支持高并发。

此外，memcache使用了多线程机制。可以同时处理多个请求。线程数一般设置为CPU核数，这研报告效率最高。

6.使用Slab分配保存数据

slab分配算法的原理是：把固定大小（1MB）的内存分为n小块，如下图所示：

slab分配算法把每1MB大小的内存称为一个slab页，每次向系统申请一个slab页，然后再通过分隔算法把这个slab页分割成若干个小块的chunk（如上图所示），然后把这些chunk分配给用户使用，分割算法如下（在slabs.c文件中）：

(注：memcache的github项目地址：)

			[cpp] view plaincopy
			
			/** 
		
			 * Determines the chunk sizes and initializes the slab class descriptors 
		
			 * accordingly. 
		
			 */  
		
			void slabs_init(const size_t limit, const double factor, const bool prealloc) {  
		
			    int i = POWER_SMALLEST - 1;  
		
			    unsigned int size = sizeof(item) + settings.chunk_size;  
		
			    mem_limit = limit;  
		
			    if (prealloc) {  
		
			        /* Allocate everything in a big chunk with malloc 通过malloc的方式申请内存*/  
		
			        mem_base = malloc(mem_limit);  
		
			        if (mem_base != NULL) {  
		
			            mem_current = mem_base;  
		
			            mem_avail = mem_limit;  
		
			        } else {  
		
			            fprintf(stderr, "Warning: Failed to allocate requested memory in"  
		
			                    " one large chunk.\nWill allocate in smaller chunks\n");  
		
			        }  
		
			    }  
		
			    memset(slabclass, 0, sizeof(slabclass));  
		
			    while (++i < POWER_LARGEST && size <= settings.item_size_max / factor) {  
		
			        /* Make sure items are always n-byte aligned  注意这里的字节对齐*/  
		
			        if (size % CHUNK_ALIGN_BYTES)  
		
			            size += CHUNK_ALIGN_BYTES - (size % CHUNK_ALIGN_BYTES);  
		
			        slabclass[i].size = size;  
		
			        slabclass[i].perslab = settings.item_size_max / slabclass[i].size;  
		
			        size *= factor;//以1.25为倍数增大chunk  
		
			        if (settings.verbose > 1) {  
		
			            fprintf(stderr, "slab class %3d: chunk size %9u perslab %7u\n",  
		
			                    i, slabclass[i].size, slabclass[i].perslab);  
		
			        }  
		
			    }  
		
			    power_largest = i;  
		
			    slabclass[power_largest].size = settings.item_size_max;  
		
			    slabclass[power_largest].perslab = 1;  
		
			    if (settings.verbose > 1) {  
		
			        fprintf(stderr, "slab class %3d: chunk size %9u perslab %7u\n",  
		
			                i, slabclass[i].size, slabclass[i].perslab);  
		
			    }  
		
			    /* for the test suite:  faking of how much we've already malloc'd */  
		
			    {  
		
			        char *t_initial_malloc = getenv("T_MEMD_INITIAL_MALLOC");  
		
			        if (t_initial_malloc) {  
		
			            mem_malloced = (size_t)atol(t_initial_malloc);  
		
			        }  
		
			    }  
		
			    if (prealloc) {  
		
			        slabs_preallocate(power_largest);  
		
			    }  
		
			}

上面代码中的slabclass是一个类型为slabclass_t结构的数组，其定义如下：

			[cpp] view plaincopy
			
			typedef struct {  
		
			    unsigned int size;      /* sizes of items */  
		
			    unsigned int perslab;   /* how many items per slab */  
		
			    void **slots;           /* list of item ptrs */  
		
			    unsigned int sl_total;  /* size of previous array */  
		
			    unsigned int sl_curr;   /* first free slot */  
		
			    void *end_page_ptr;         /* pointer to next free item at end of page, or 0 */  
		
			    unsigned int end_page_free; /* number of items remaining at end of last alloced page */  
		
			    unsigned int slabs;     /* how many slabs were allocated for this class */  
		
			    void **slab_list;       /* array of slab pointers */  
		
			    unsigned int list_size; /* size of prev array */  
		
			    unsigned int killing;  /* index+1 of dying slab, or zero if none */  
		
			    size_t requested; /* The number of requested bytes */  
		
			} slabclass_t;

借用别人的一张图说明slabclass_t结构:

由分割算法的源代码可知，slab算法按照不同大小的chunk分割slab页，而不同大小的chunk以factor（默认是1.25）倍增大。

使用memcache -u root -vv 命令查看内存分配情况(8字节对齐)：

找到大小最合适的chunk分配给请求缓存的数据：

			[cpp] view plaincopy
			
			/* 
		
			 * Figures out which slab class (chunk size) is required to store an item of 
		
			 * a given size. 
		
			 * 
		
			 * Given object size, return id to use when allocating/freeing memory for object 
		
			 * 0 means error: can't store such a large object 
		
			 */  
		
			unsigned int slabs_clsid(const size_t size) {  
		
			    int res = POWER_SMALLEST;// 初始化为最小的chunk  
		
			    if (size == 0)  
		
			        return 0;  
		
			    while (size > slabclass[res].size) //逐渐增大chunk size，直到找到第一个比申请的size大的chunk  
		
			        if (res++ == power_largest)     /* won't fit in the biggest slab */  
		
			            return 0;  
		
			    return res;  
		
			}

内存分配：

（此处参考：）

			[cpp] view plaincopy
			
			static void *do_slabs_alloc(const size_t size, unsigned int id) {  
		
			    slabclass_t *p;  
		
			    void *ret = NULL;  
		
			    item *it = NULL;  
		
			    if (id < POWER_SMALLEST || id > power_largest) {//判断id是否会导致slabclass[]数组越界  
		
			        MEMCACHED_SLABS_ALLOCATE_FAILED(size, 0);  
		
			        return NULL;  
		
			    }  
		
			    p = &slabclass[id];//获取slabclass[id]的引用  
		
			    assert(p->sl_curr == 0 || ((item *)p->slots)->slabs_clsid == 0);//判断slabclass[id]是否有剩余的chunk  
		
			    if (! (p->sl_curr != 0 || do_slabs_newslab(id) != 0)) {//如果slabclass[id]中已经没有空余chunk并且试图向系统申请一个“页”（slab）的chunk失败,则返回NULL  
		
			    /* We don't have more memory available */  
		
			        ret = NULL;  
		
			    } else if (p->sl_curr != 0) {//slabclass[id]的空闲链表中还有chunk，则直接将其分配出去  
		
			        it = (item *)p->slots;//获取空闲链表的头指针  
		
			        p->slots = it->next;//将头结点指向下一个结点（取下头结点）  
		
			        if (it->next) it->next->prev = 0;//将新头结点的prev指针置空  
		
			        p->sl_curr--;//减少slabclass[id]空闲链表中的chunk计数  
		
			        ret = (void *)it;//将头结点赋给ret指针  
		
			    }  
		
			    if (ret) {//请求成功  
		
			        p->requested += size;//更新slabclass[id]所分配的内存总数  
		
			        MEMCACHED_SLABS_ALLOCATE(size, id, p->size, ret);  
		
			    } else {  
		
			        MEMCACHED_SLABS_ALLOCATE_FAILED(size, id);  
		
			    }  
		
			    return ret;  
		
			}

do_slabs_allc()函数首先尝试从slot列表（被回收的chunk）中获取可用的chunk,如果有可用的就返回，否则从空闲的chunk列表中获取可用的chunk并返回。

删除过期item:

延迟删除过期item到查找时进行，可以提高memcache的效率，因为不必每时每刻检查过期item,从而提高CPU工作效率

使用LRU(last recently used)算法淘汰数据：

			[cpp] view plaincopy
			
			/* 
		
			 * try to get one off the right LRU 
		
			 * don't necessariuly unlink the tail because it may be locked: refcount>0 
		
			 * search up from tail an item with refcount==0 and unlink it; give up after 50 
		
			 * tries 
		
			 */  
		
			if (tails[id] == 0) {  
		
			    itemstats[id].outofmemory++;  
		
			    return NULL;  
		
			}  
		
			for (search = tails[id]; tries > 0 && search != NULL; tries--, search=search->prev) {  
		
			    if (search->refcount == 0) { //refount==0的情况，释放掉  
		
			        if (search->exptime == 0 || search->exptime > current_time) {  
		
			            itemstats[id].evicted++;  
		
			            itemstats[id].evicted_time = current_time - search->time;  
		
			            STATS_LOCK();  
		
			            stats.evictions++;  
		
			            STATS_UNLOCK();  
		
			        }  
		
			        do_item_unlink(search);  
		
			        break;  
		
			    }  
		
			}  
		
			it = slabs_alloc(ntotal, id);  
		
			if (it == 0) {  
		
			    itemstats[id].outofmemory++;  
		
			    /* Last ditch effort. There is a very rare bug which causes 
		
			     * refcount leaks. We've fixed most of them, but it still happens, 
		
			     * and it may happen in the future. 
		
			     * We can reasonably assume no item can stay locked for more than 
		
			     * three hours, so if we find one in the tail which is that old, 
		
			     * free it anyway. 
		
			     */  
		
			    tries = 50;  
		
			    for (search = tails[id]; tries > 0 && search != NULL; tries--, search=search->prev) {  
		
			        if (search->refcount != 0 && search->time + 10800 < current_time) { //最近3小时没有被访问到的情况，释放掉  
		
			            itemstats[id].tailrepairs++;  
		
			            search->refcount = 0;  
		
			            do_item_unlink(search);  
		
			            break;  
		
			        }  
		
			    }  
		
			    it = slabs_alloc(ntotal, id);  
		
			    if (it == 0) {  
		
			        return NULL;  
		
			    }  
		
			}

从item列表的尾部开始遍历，找到refcount==0的chunk,调用do_item_unlink()函数释放掉，另外，search->time+10800

附：阿里2014笔试题一道：

某缓存系统采用LRU淘汰算法，假定缓存容量为4,并且初始为空，那么在顺序访问一下数据项的时候：1,5,1,3,5,2,4,1,2出现缓存直接命中的次数是？，最后缓存中即将准备淘汰的数据项是？

答案：3， 5

解答：

1调入内存 1
5调入内存 1 5
1调入内存 5 1（命中 1，更新次序）
3调入内存 5 1 3
5调入内存 1 3 5 （命中5）
2调入内存 1 3 5 2
4调入内存（1最久未使用，淘汰1） 3 5 2 4
1调入内存（3最久未使用，淘汰3） 5 2 4 1
2调入内存 5 4 1 2（命中2）

因此，直接命中次数是3,最后缓存即将准备淘汰的数据项是5

阅读(2388) | 评论(0) | 转发(0) |

上一篇：大并发网站session同步和原理

下一篇：php使用memcache存储session

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6