MongoDB性能测试与Python测试代码-逊云锋-ChinaUnix博客

逊云锋的ChinaUnix博客

首页　| 　博文目录　| 　关于我

逊云锋

博客访问： 899155
博文数量： 372
博客积分： 10063
博客等级：中将
技术积分： 4220
用户组：普通用户
注册时间： 2012-02-24 11:36

文章分类

全部博文（372）

php（0）
net（1）
设计模式（2）
sharepoint（2）
arc（2）
xml（1）
Oracle（4）
ＳＱＬ（6）
DataBase（2）
css（2）
LOGO（2）
Ruby（0）
vstl（1）
WPF应用（3）
LING（1）
Delphi（0）
python（1）
javafx（3）
java（4）
linux（0）
Azure（4）
could（3）
hadoop（2）
Web前端（5）
平台开发（4）
C#, 模板引擎（7）
架构实战（2）
Object-oriented（2）
负载均衡（3）
web架构师（5）
Extjs（1）
Javascript（16）
HTML（21）
jquery（21）
未分配的博文（239）

文章存档

2012年（372）

我的朋友

相关博文

MongoDB性能测试与Python测试代码

分类：虚拟化

2012-03-03 14:34:21

最近参与公司一个项目，计划对在线平台的大规模查询做到快速响应，预估数据总量大概在2-3亿条，数据库并发量大概每秒1500，一年后并发大概3000每秒，经过在Redis和mongodb之间艰难的选择之后，决定使用mongodb，主要看中其平行扩展能力和GridFS上的Map/Reduce。预估项目完成上线后，高峰时段每秒并发查询在1500-3000之间。

其实我个人是比较喜欢Redis的，其并发查询能力和超越memcached的速度都很令人心动，不过其持久化和集群扩展性不太适合业务需要，所以最后还是选择了mongodb。

下面是对mongodb测试的代码和结果。虽然公司用的一水的CentOS，但是由于我是FreeBSD的支持者，所以在FreeBSD和CentOS上都测试了一下结果。

写库程序是网上抄来的，查询程序是自己写的。

写库程序

#!/usr/bin/env python

from pymongo import Connection
import time,datetime

connection = Connection('127.0.0.1', 27017)
db = connection['hawaii']

#时间记录器
def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper

@func_time
def insert(num):
posts = db.userinfo
for x in range(num):
post = {"_id" : str(x),
"author": str(x)+"Mike",
"text": "My first blog post!",
"tags": ["mongodb", "python", "pymongo"],
"date": datetime.datetime.utcnow()}
posts.insert(post)

if __name__ == "__main__":
#设定循环500万次
num = 5000000
insert(num)

查询程序

#!/usr/bin/env python

from pymongo import Connection
import time,datetime
import random

connection = Connection('127.0.0.1', 27017)
db = connection['hawaii']

def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper

#@func_time
def randy():
rand = random.randint(1,5000000)
return rand

@func_time
def mread(num):
find = db.userinfo
for i in range(num):
rand = randy()
#随机数查询
find.find({"author": str(rand)+"Mike"})

if __name__ == "__main__":
#设定循环100万次
num = 1000000
mread(num)

删除程序

#!/usr/bin/env python

from pymongo import Connection
import time,datetime

connection = Connection('127.0.0.1', 27017)
db = connection['hawaii']

def func_time(func):
def _wrapper(*args,**kwargs):
start = time.time()
func(*args,**kwargs)
print func.__name__,'run:',time.time()-start
return _wrapper

@func_time
def remove():
posts = db.userinfo
print 'count before remove:',posts.count();
posts.remove({});
print 'count after remove:',posts.count();

if __name__ == "__main__":
remove()

结果集

	插入500万	随机数查询100万	删除500万	CPU占用
CentOS	394s	28s	224s	25-30%
FreeBSD	431s	18s	278s	20-22%

CentOS插入和删除胜出；FreeBSD发挥了UFS2的优势，读取胜出。

由于是作为查询服务器使用，所以读取速度快是个优势，不过我不是领导，我说了不算，最终还是得CentOS。

在测试中，一直使用mongostat监控，从并发数量上，两个系统差不多。还测试了插入并发查询，不过结果差不多，大概并发的相加和都是15000-25000每秒。性能还是很不错的。

不过确实大数据量下插入性能下降比较严重，CentOS测试了5000万数据插入，耗时接近2小时。大概是6300多秒。比起500万数据插入速度，差不多慢了50%。不过查询速度还算差不多。

测试结果供需要者做个参考。

不过，这个测试不是太公平。FreeBSD配置要差一点。

CentOS 16G内存，Xeon5606 两颗8核。Dell品牌机。

FreeBSD 8G内存，Xeon5506 一颗4核。攒的没牌子1U。

如果相同环境下，我觉得还是FreeBSD性能会比较好一点。

本文出自 “实践检验真理” 博客，转载请与作者联系！

阅读(2387) | 评论(0) | 转发(4) |

上一篇：浏览器在不开启Cookie下Session处理小结

下一篇：网站全局参数定义成常量的好处!

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6