NUMA和SMP 架构区别以及对SWAP的影响-gflei-ChinaUnix博客

学而时习之gflei.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

gflei

博客访问： 2364218
博文数量： 310
博客积分： 6853
博客等级：准将
技术积分： 2833
用户组：普通用户
注册时间： 2005-08-04 16:41

文章分类

全部博文（310）

net（7）
工具（4）
Windows（26）

windows阀值（5）

硬件配置（3）

批处理（8）
UNIX&LINUX（52）

问题排查（8）

Security（1）

LINUX（31）

AIX（5）

HP-UX 学习（2）
JAVA（2）

RMI（1）
邮件服务器（1）
Mysql（20）

sql_reference（7）

优化（2）

数据库管理（6）

JDBC（2）

用户管理（1）
SQLSERVER（62）

性能（12）

SQL-REFERENCE（8）

maintain（15）

Concept（4）

lock（15）
Oracle（108）

SQL_REFERENCE（4）

Wait（3）

基础概念（3）

安全（11）

Client（5）

日常维护（7）

常见错误（27）

性能（19）

内存（9）

存储（11）

Lock（3）
LoadRunner（4）
应用服务器（4）

TOMCAT（2）

WEBSPHERE（1）
Apache（17）

虚拟主机（5）

与tomcat集成（5）

FAQ（0）
未分配的博文（3）

文章存档

2013年（17）

2012年（42）

2011年（76）

2010年（71）

2009年（99）

2007年（2）

2006年（1）

2005年（2）

我的朋友

相关博文

NUMA和SMP 架构区别以及对SWAP的影响

分类： Mysql/postgreSQL

2013-04-17 14:09:41

必须得承认，即使看完了和，swap仍然可能顽固地在主机上复现。不过幸运的是，最近一年来众多swap问题的受害者们通过不懈的努力找到了终极原因——NUMA。下面站在巨人的肩膀上，为大家简单讲解一下NUMA的原理和优化方法。

一、NUMA和SMP
NUMA和SMP是两种CPU相关的硬件架构。在SMP架构里面，所有的CPU争用一个总线来访问所有内存，优点是资源共享，而缺点是总线争用激烈。随着PC服务器上的CPU数量变多（不仅仅是CPU核数），总线争用的弊端慢慢越来越明显，于是Intel在Nehalem CPU上推出了NUMA架构，而AMD也推出了基于相同架构的Opteron CPU。
NUMA最大的特点是引入了node和distance的概念。对于CPU和内存这两种最宝贵的硬件资源，NUMA用近乎严格的方式划分了所属的资源组（node），而每个资源组内的CPU和内存是几乎相等。资源组的数量取决于物理CPU的个数（现有的PC server大多数有两个物理CPU，每个CPU有4个核）；distance这个概念是用来定义各个node之间调用资源的开销，为资源调度优化算法提供数据支持。

二、NUMA相关的策略
1、每个进程（或线程）都会从父进程继承NUMA策略，并分配有一个优先node。如果NUMA策略允许的话，进程可以调用其他node上的资源。
2、NUMA的CPU分配策略有cpunodebind、physcpubind。cpunodebind规定进程运行在某几个node之上，而physcpubind可以更加精细地规定运行在哪些核上。
3、NUMA的内存分配策略有localalloc、preferred、membind、interleave。localalloc规定进程从当前node上请求分配内存；而preferred比较宽松地指定了一个推荐的node来获取内存，如果被推荐的node上没有足够内存，进程可以尝试别的node。membind可以指定若干个node，进程只能从这些指定的node上请求分配内存。interleave规定进程从指定的若干个node上以RR算法交织地请求分配内存。

三、NUMA和swap的关系
可能大家已经发现了，NUMA的内存分配策略对于进程（或线程）之间来说，并不是公平的。在现有的Redhat Linux中，localalloc是默认的NUMA内存分配策略，这个配置选项导致资源独占程序很容易将某个node的内存用尽。而当某个node的内存耗尽时，Linux又刚好将这个node分配给了某个需要消耗大量内存的进程（或线程），swap就妥妥地产生了。尽管此时还有很多page cache可以释放，甚至还有很多的free内存。

四、解决swap问题
虽然NUMA的原理相对复杂，实际上解决swap却很简单：只要在启动MySQL之前使用numactl –interleave来修改NUMA策略即可。
值得注意的是，numactl这个命令不仅仅可以调整NUMA策略，也可以用来查看当前各个node的资源是用情况，是一个很值得研究的命令。

引用资料：
The MySQL “swap insanity” problem and the effects of the NUMA architecture

Linux Administrator’s Manual（#man numactl）

阅读(6985) | 评论(0) | 转发(0) |

上一篇：mysql query cache 基本概念及实验

下一篇：mysql 内存表

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6