Ceph V9.2.0版本(代号INFERNALIS)已发布-xiong9937-ChinaUnix博客

storage&nbsp;architect

首页　| 　博文目录　| 　关于我

xiong9937

博客访问： 2008897
博文数量： 1000
博客积分： 0
博客等级：民兵
技术积分： 7921
用户组：普通用户
注册时间： 2013-08-20 09:23

个人简介

storage R&D guy.

文章分类

全部博文（1000）

hh（5）
python（1）
flashcache（2）
levelDB（12）
java（4）
mac（5）
zookeeper（73）
ceph（108）
investation（2）
raid（3）
USB（21）
raise（1）
others（2）
salary（2）
salary（0）
KVM（11）
3G（2）
SAS（3）
PMC（2）
cold（24）
algorithm（9）
HDFS（92）
HDFS（4）
gdb（5）
hp（1）
DDK（27）
C（25）
eclipse（3）
tools（52）
kernel（37）
iscsi（19）
HPC（1）
FS（35）
scst（15）
istributed （5）
cloud（19）
NAS（41）
intel（1）
algorithm（0）
command（2）
tcpip（18）
documents（2）
board（1）
memory（13）
management（1）
linux boot（34）
bios（3）
pcie（56）
memory（3）
ethnet（56）
driver（3）
fcoe（13）
FC（14）
english（4）
switch（2）
links（14）
private（0）
protocal（0）
office（2）
network（2）
vm（8）
database（1）
os（43）
storage（27）

fcoe（4）
server（3）
未分配的博文（1）

文章存档

2019年（5）

2017年（47）

2016年（38）

2015年（539）

2014年（193）

2013年（178）

我的朋友

自Hammer版本以来所做的重要修改

General

Ceph的守护进程现已通过systemd来管理(Ubuntu Trusty是个例外，仍沿用upstart来管理)。
Ceph的守护进程以ceph用户而非root运行。
在Red Hat的发行版本中，也存在SeLinux Policy。

RADOS

RADOS的cache层现在可通过代理将写操作发送到持久层(base tier)，允许直接处理写操作无需先强制将对象移至cache层。
对SHEC 纠删码的支持已不再标记为实验性的。SHEC通过消耗一些额外的存储空间来换取更快的修复速度。
为（优化）客户端IO、数据恢复、数据清理、快照裁剪提供统一的队列。
对低层级的修复工具（ceph-objectstore-tool）做了许多改进。
为方便使用新的存储后端（如NewStore），内部ObjectStore API已做了重大的修改。

Swift API现已支持对象过期机制
Swift API的兼容性得到了很大的改善

通过rbd du命令显示实际的使用（容量）信息（当object-map处于enabled状态时该操作很快）
对object-map特性的稳定性做了许多改善。
object-map和exclusive-lock特性可动态的开启或者关闭。
现在你可以依据个体镜像(individual image)来存储用户的元数据并设置持久的librbd选项。
新的深度扁平（deep-flatten）特性允许对一个克隆及其所有的快照进行扁平化处理（在此之前快照不能被扁平化。）
更快的export-diff命令（使用了aio）。另外新增了fast-diff特性。
可通过单位后缀指定-size参数大小（如—size 64G）。
有一个新的rbd status命令，现在可通过该命令来显示谁打开/映射了某个镜像。

CephFS

发行版的兼容性

我们已决定放弃对多个旧的Linux发行版的支持，这样一来我们就可以转用更新的编译器工具链（如C++11）。尽管通过安装向后兼容的开发工具来在旧版本中生成Ceph还是可能的，但我们不会在ceph.com上为这些发行版生成并发布release版本的安装包。

我们现在为以下的版本构建安装包：

现已可对快照进行重命名操作。
在管理、诊断、检查和修复工具上已作出了持续的改善。
由未使用inode引发的client端cache状态的缓存和撤回问题已经得到极大的改善。
32位主机上，ceph-fuse客户端表现得更好。

CentOS 7或后续版本。我们已放弃对CentOS 6的支持（以及RHEL 6其它的衍生系列，如Scientific Linux 6）。
Debian Jessie 8.x或后续版本。 Debian Wheezy 7.x的g++对C++11的支持并不完整（而且没有systemd）。
Ubuntu Trusty 14.04或后续版本。 Ubuntu Precise 12.04已不再被支持。
Fedora 22或后续版本。

从Firefly更新至Infernalis

我们不推荐从Firefly v0.80.z直接更新。虽然直接更新是可能的，但会存在停机时间。我们推荐先更新至Hammer v0.94.4或之后的v0.94.z的发行版，只有这样之后才能做到线上更新至Infernalis 9.2.z(见下文)。

若需线下直接从Firefly更新至Infernalis，那么在任一Infernalis OSD允许启动之前，必须停止所有的Firefly OSD并将其标记为down状态。通过Infernalis的监控器来保证这种隔离机制，因此，使用类似如下的升级步骤：

在monitor主机上更新Ceph
重启所有的ceph-mon守护进程
在所有的OSD主机上更新Ceph
停止所有的ceph-osd守护进程
将所有的OSD标记为down，所用的执行命令类似于：ceph osd down seq 0 1000
启动所有的ceph-osd守护进程
升级并重启余下的守护进程(ceph-mds, radosgw)

从Hammer更新至Infernalis

对于支持systemd(CentOS 7, Fedora, Debian Jessie 8.x, OpenSUSE)的所有Linux发行版，Ceph守护进程现在使用原生的systemd文件而不是遗留的sysvinit脚本来进行管理。比如：

systemctl start ceph.target # start all daemons

systemctl status ceph-osd@12 # check status of osd 12

主流的发行版中，Ubuntu trusty 14.04还未使用systemd。(下一个Ubuntu LTS，16.04，将会使用systemd替换upstart)。
现在，默认情况下，Ceph守护进程将以ceph用户和组的身份运行。在Fedora和Debian（以及其他诸如RHEL/CentOS和Ubuntu等衍生发行版）中ceph用户被赋予了一个静态UID。在SUSE中 ceph用户会在其创建的时候被动态的赋予一个UID。

如果你的系统中已有ceph用户，那么升级安装包的过程中将会出现问题。我们建议在升级前，先移除或重命名已有的ceph用户或ceph组。

升级过程中，管理员有两个选择：

将如下行添加至所有主机的ceph.conf中：

setuser match path = /var/lib/ceph/

这将使得Ceph的守护进程以root身份运行（即：未放弃特权及切换至ceph用户），如果Ceph守护进程的数据目录的所有者仍是root。新部署的守护进程将以ceph用户来创建数据目录，并以非特权运行，但升级的守护进程仍以root身份运行。
升级过程中修复数据的所有权。这是我们所偏好的选择，但这需要做更多工作而且耗时。对每个主机，需做如下步骤的操作：

a.升级ceph安装包。这就创建了ceph用户和组。如：

ceph-deploy install —stable infernalis HOST

b.停止守护进程

service ceph stop # fedora, centos, rhel, debian

stop ceph-all # ubuntu

c.修复所有权

chown -R ceph:ceph /var/lib/ceph/$type/$cluster-$id

d.重启守护进程

start ceph-all # ubuntu

systemctl start ceph.target # debian, centos, fedora, rhel

可选的，相同的过程可以用单一的守护进程类型来完成，比如：只停止监控器并改变/var/lib/ceph/mon的所有者。

处于实验阶段的KeyValueStore OSD后端所采用的磁盘格式(on-disk format)已发生了变化。如果你所要升级的测试集群中用到了它，那么你需要移除所有用到该后端的OSD。
与集群满一样，当达到存储池的配额时，librados操作将会无限期阻塞。（而之前的版本中会返回-ENOSPC）。默认状态下，当一个集群或pool满了，就会发生阻塞。如果你的librados应用能优雅地处理ENOSPC或EDQUOT等错误，那么你可以通过使用lirados中新的 OPERATION_FULL_TRY标记来获取错误返回码。
librbd的rbd_aio_read和Image::aio_read API方法在成功时将不再返回已读的字节数，而是在成功时返回0，失败时返回一个负值。
‘ceph scrub’, ‘ceph compact’ 和 ‘ceph sync force’ 已弃用，取而代之的是 ‘ceph mon scrub’, ‘ceph mon compact’ 和 ‘ceph mon sync force’。
‘ceph mon_metadata’ 现在应写成 ‘ceph mon metadata’。没有必要弃用这个命令（自引入以来一直存在）。
osdmaptool命令的–dump-json已由–dump json替换。
pg ls-by-{pool,primary,osd} 和 pg ls 这两命令中的recovery参数改为了recovering, 用来包含所列出的pg中正处于recovering状态的pg。
…

阅读(1472) | 评论(0) | 转发(0) |

上一篇：解析Ceph: Snapshot

下一篇：Ceph剖析：故障检测

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

自Hammer版本以来所做的重要修改

发行版的兼容性

从Firefly更新至Infernalis

从Hammer更新至Infernalis