MongoDB教程(笔记)-夏寥寥-ChinaUnix博客

一只特立独行的猪

首页　| 　博文目录　| 　关于我

夏寥寥

博客访问： 695881
博文数量： 125
博客积分： 10
博客等级：民兵
技术积分： 962
用户组：普通用户
注册时间： 2012-10-14 10:20

个人简介

我是一只小白兔~

文章分类

全部博文（125）

General（2）
系统架构（1）
监控工具（2）

CACTI（0）

ZABBIX（2）

NAGIOS（0）
集群、负载均衡（1）

负载均衡（0）

服务器集群（0）
虚拟化（3）

VMWare（1）

LVS（2）

KVM（0）

Docker（0）

XEN（0）
自动化运维工具（3）

Ansible（0）

Git（1）

Puppet（2）
题目（0）

Linux（0）

网络（0）
开源服务器（19）

Memcached（1）

TOMCAT（1）

NGINX（12）

Apache（3）
编程语言（0）

JAVA（0）

Python（0）
网络、安全（11）

iptables（5）

tcpdump（1）
高并发、高可用（5）

LVS（0）

KeepAlived（2）

HAPRoxy（2）
数据库（30）

MongoDB.（8）

Redis（3）

MySQL（11）

Oracle（8）
操作系统（48）

Shell（35）

Ubuntu（0）

CentOS（5）

RHEL（1）
未分配的博文（0）

文章存档

2017年（16）

2016年（108）

2014年（1）

我的朋友

相关博文

MongoDB教程(笔记)

分类： NOSQL

2016-07-27 09:14:51

一、NoSQL简介

1.什么是NoSQL
NoSQL，指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写，是对不同于传统的关系型数据库的数据库管理系统的统称。

NoSQL用于超大规模数据的存储。（例如谷歌或Facebook每天为他们的用户收集万亿比特的数据）。这些类型的数据存储不需要固定的模式，无需多余操作就可以横向扩展。

2.RDBMS vs NoSQL

RDBMS

- 高度组织化结构化数据
- 结构化查询语言（SQL） (SQL)
- 数据和关系都存储在单独的表中。
- 数据操纵语言，数据定义语言
- 严格的一致性
- 基础事务

NoSQL
- 代表着不仅仅是SQL
- 没有声明性查询语言
- 没有预定义的模式
-键 - 值对存储，列存储，文档存储，图形数据库
- 最终一致性，而非ACID属性
- 非结构化和不可预知的数据
- CAP定理
- 高性能，高可用性和可伸缩性

3.CAP定理

在计算机科学中, CAP定理（CAP theorem）, 又被称作布鲁尔定理（Brewer's theorem）, 它指出对于一个分布式计算系统来说，不可能同时满足以下三点:
(1)一致性(Consistency) (所有节点在同一时间具有相同的数据)
(2)可用性(Availability) (保证每个请求不管成功或者失败都有响应)
(3)分隔容忍(Partition tolerance) (系统中任意信息的丢失或失败不会影响系统的继续运作)

CAP理论的核心是：一个分布式系统不可能同时很好的满足一致性，可用性和分区容错性这三个需求，最多只能同时较好的满足两个。
因此，根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三大类：
(1)CA - 单点集群，满足一致性，可用性的系统，通常在可扩展性上不太强大。
(2)CP - 满足一致性，分区容忍必的系统，通常性能不是特别高。
(3)AP - 满足可用性，分区容忍性的系统，通常可能对一致性要求低一些。

4.NoSQL的优缺点

【优点】
高可扩展性
分布式计算
低成本
架构的灵活性，半结构化数据
没有复杂的关系
【缺点】
没有标准化
有限的查询功能（到目前为止）
最终一致是不直观的程序

5.NoSQL数据库的分类

类型	部分代表	特点
列存储	Hbase Cassandra Hypertable	顾名思义，是按列存储数据的。最大的特点是方便存储结构化和半结构化数据，方便做数据压缩，对针对某一列或者某几列的查询有非常大的IO优势。
文档存储	MongoDB CouchDB	文档存储一般用类似json的格式存储，存储的内容是文档型的。这样也就有有机会对某些字段建立索引，实现关系数据库的某些功能。
key-value存储	Tokyo Cabinet / Tyrant Berkeley DB MemcacheDB Redis	可以通过key快速查询到其value。一般来说，存储不管value的格式，照单全收。（Redis包含了其他功能）
图存储	Neo4J FlockDB	图形关系的最佳存储。使用传统关系数据库来解决的话性能低下，而且设计使用不方便。
对象存储	db4o Versant	通过类似面向对象语言的语法操作数据库，通过对象的方式存取数据。
xml数据库	Berkeley DB XML BaseX	高效的存储XML数据，并支持XML的内部查询语法，比如XQuery,Xpath。

RDBMS	MongoDB
数据库	数据库
表格	集合
行	文档
列	字段
表联合	嵌入文档
主键	主键 (MongoDB 提供了 key 为 _id )
数据库服务和客户端
Mysqld/Oracle	mongod
mysql/sqlplus	mongo

二、MongoDB简介

1.mongodb的安装(Linux平台)
(1)首先去mongodb的官网下载安装文件,例如下载的文件为mongodb-linux-i686-3.2.8.tgz
(2)切换到/usr/local,然后解压文件到该目录下，并将解压后的目录mongodb-linux-i686-3.2.8重命名为mongodb
$>tar -xvf mongodb-linux-i686-3.2.8.tgz
(3)启动mongod
./mongod -port=27017 -storageEngine=mmapv1 --dbpath=/usr/local/mongodb/data/db --journal

说明：mongod为mongodb的服务端；
-storageEngine=mmapv1：设置存储引擎为mmapv1
--dbpath=/usr/local/mongodb/data/db：指定数据目录的路径
--journal：开启journal
(4)打开客户端mongo
$>./mongo

2.Mongodb概念解析

【数据库】
一个mongodb中可以建立多个数据库。

MongoDB的默认数据库为"db"，该数据库存储在data目录中。

MongoDB的单个实例可以容纳多个独立的数据库，每一个都有自己的集合和权限，不同的数据库也放置在不同的文件中。

show dbs：显示所有数据的列表。
db ：显示当前数据库对象或集合。
use：可以连接到一个指定的数据库。

数据库也通过名字来标识。数据库名可以是满足以下条件的任意UTF-8字符串。

不能是空字符串（"")。

不得含有' '（空格)、.、$、/、\和\0 (空宇符)。

应全部小写。

最多64字节。

有一些数据库名是保留的，可以直接访问这些有特殊作用的数据库。

admin：从权限的角度来看，这是"root"数据库。要是将一个用户添加到这个数据库，这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行，比如列出所有的数据库或者关闭服务器。

local: 这个数据永远不会被复制，可以用来存储限于本地单台服务器的任意集合

config: 当Mongo用于分片设置时，config数据库在内部使用，用于保存分片的相关信息。

【文档】

文档是一个键值(key-value)对(即BSON)。MongoDB 的文档不需要设置相同的字段，并且相同的字段不需要相同的数据类型，这与关系型数据库有很大的区别，也是 MongoDB 非常突出的特点。
下表列出了 RDBMS 与 MongoDB 对应的术语：

RDBMS MongoDB

数据库数据库

表格集合

行文档

列字段

表联合嵌入文档

主键主键 (MongoDB 提供了 key 为 _id )

数据库服务和客户端

Mysqld/Oracle mongod

mysql/sqlplus mongo

需要注意的是：

文档中的键/值对是有序的。

文档中的值不仅可以是在双引号里面的字符串，还可以是其他几种数据类型（甚至可以是整个嵌入的文档)。

MongoDB区分类型和大小写。

MongoDB的文档不能有重复的键。

文档的键是字符串。除了少数例外情况，键可以使用任意UTF-8字符。

文档键命名规范：

键不能含有\0 (空字符)。这个字符用来表示键的结尾。

.和$有特别的意义，只有在特定环境下才能使用。

以下划线"_"开头的键是保留的(不是严格要求的)。

【集合】

集合就是 MongoDB 文档组，类似于 RDBMS （关系数据库管理系统：Relational Database Management System)中的表格。

集合存在于数据库中，集合没有固定的结构，这意味着你在对集合可以插入不同格式和类型的数据，但通常情况下我们插入集合的数据都会有一定的关联性。

比如，我们可以将以下不同数据结构的文档插入到集合中：

{"site":""} {"site":"","name":"Google"} {"site":"","name":"菜鸟教程","num":5}

当第一个文档插入时，集合就会被创建。

合法的集合名

集合名不能是空字符串""。
集合名不能含有\0字符（空字符)，这个字符表示集合名的结尾。
集合名不能以"system."开头，这是为系统集合保留的前缀。
用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含，这是因为某些系统生成的集合中包含该字符。除非你要访问这种系统创建的集合，否则千万不要在名字里出现$。

如下实例：

db.col.findOne()

capped collections

Capped collections 就是固定大小的collection。

它有很高的性能以及队列过期的特性(过期按照插入的顺序). 有点和 "RRD" 概念类似。

Capped collections是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能和标准的collection不同，你必须要显式的创建一个capped collection，指定一个collection的大小，单位是字节。collection的数据存储空间值提前分配的。

要注意的是指定的存储大小包含了数据库的头信息。

db.createCollection("mycoll", {capped:true, size:100000})

在capped collection中，你能添加新的对象。
能进行更新，然而，对象不会增加存储空间。如果增加，更新就会失败。
数据库不允许进行删除。使用drop()方法删除collection所有的行。
注意: 删除之后，你必须显式的重新创建这个collection。
在32bit机器中，capped collection最大存储为1e9( 1X10⁹)个字节。

【元数据】

数据库的信息是存储在集合中。它们使用了系统的命名空间：

dbname.system.*

在MongoDB数据库中名字空间 .system.* 是包含多种系统信息的特殊集合(Collection)，如下:

集合命名空间	描述
dbname.system.namespaces	列出所有名字空间。
dbname.system.indexes	列出所有索引。
dbname.system.profile	包含数据库概要(profile)信息。
dbname.system.users	列出所有可访问数据库的用户。
dbname.local.sources	包含复制对端（slave）的服务器信息和状态。

对于修改系统集合中的对象有如下限制。

在{{system.indexes}}插入数据，可以创建索引。但除此之外该表信息是不可变的(特殊的drop index命令将自动更新相关信息)。

{{system.users}}是可修改的。 {{system.profile}}是可删除的。

MongoDB 数据类型

下表为MongoDB中常用的几种数据类型。

数据类型	描述
String	字符串。存储数据常用的数据类型。在 MongoDB 中，UTF-8 编码的字符串才是合法的。
Integer	整型数值。用于存储数值。根据你所采用的服务器，可分为 32 位或 64 位。
Boolean	布尔值。用于存储布尔值（真/假）。
Double	双精度浮点值。用于存储浮点值。
Min/Max keys	将一个值与 BSON（二进制的 JSON）元素的最低值和最高值相对比。
Arrays	用于将数组或列表或多个值存储为一个键。
Timestamp	时间戳。记录文档修改或添加的具体时间。
Object	用于内嵌文档。
Null	用于创建空值。
Symbol	符号。该数据类型基本上等同于字符串类型，但不同的是，它一般用于采用特殊符号类型的语言。
Date	日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间：创建 Date 对象，传入年月日信息。
Object ID	对象 ID。用于创建文档的 ID。
Binary Data	二进制数据。用于存储二进制数据。
Code	代码类型。用于在文档中存储 JavaScript 代码。
Regular expression	正则表达式类型。用于存储正则表达式。

三、创建、删除数据库

MongoDB 创建数据库的语法格式如下：

use DATABASE_NAME

MongoDB 删除数据库的语法格式如下：

db.dropDatabase()

查看当前数据库名称：db
查看所有数据库：show dbs

删除集合语法格式如下：

db.collection.drop()

四、MongoDB 插入文档

所有存储在集合中的数据都是BSON格式。

1.插入文档
MongoDB 使用 insert() 或 save() 方法向集合中插入文档，语法如下：

db.COLLECTION_NAME.insert(document)

以下文档可以存储在 MongoDB 的 runoob 数据库的 col集合中：

点击(此处)折叠或打开

>db.col.insert({title: 'MongoDB 教程',
description: 'MongoDB 是一个 Nosql 数据库',
by: '菜鸟教程',
url: 'http://',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 100
})

以上实例中 col 是我们的集合名，如果该集合不在该数据库中， MongoDB 会自动创建该集合并插入文档.
查看已插入文档：

> db.col.find()

也可以将数据定义为一个变量，如下所示：

点击(此处)折叠或打开

> document=({title: 'MongoDB 教程',
description: 'MongoDB 是一个 Nosql 数据库',
by: '菜鸟教程',
url: 'http://',
tags: ['mongodb', 'database', 'NoSQL'],
likes: 100
})

执行插入操作：

> db.col.insert(document) WriteResult({ "nInserted" : 1 }) >

插入文档你也可以使用 db.col.save(document) 命令。如果不指定 _id 字段 save() 方法类似于 insert() 方法。如果指定 _id 字段，则会更新该 _id 的数据。

阅读(1978) | 评论(0) | 转发(0) |

上一篇：深入浅出Oracle:DBA入门、进阶与诊断案例（读书笔记2)

下一篇：Oracle从入门到精通(笔记)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6