脚踏实地
全部博文(230)
分类: 云计算
2016-12-20 23:16:38
最近在云平台中架设了三台节点的CoreOS集群,虽然对于很多云平台和虚拟化管理平台,官方都提供了安装脚本,但由于我所使用的云平台的一些原因,我无法选择使用官方的云平台部署脚本,所以本次纪录,是纪录直接在虚拟机中安装CoreOS的过程,理论上安装步骤适用于裸机安装。遇到了一些坑,特此记录,希望对初次接触CoreOS的童鞋有所借鉴和帮助。
你可能会觉得这一步很简单,但是,我不得不说,这个过程我花费了最多的时间。
由于官方的镜像下载源被伟大的GFW墙了,所以我无法直接下载这个ISO!
解决过程:我尝试使用迅雷下载,发现没速度,于是找同学拿了个某雷的VIP账号,把镜像下载下来了,速度奇慢
注:目前这个ISO下载地址似乎可以直接访问了CoreOS ISO
略
虽然这一步不是必须的,但我觉得,这一步是必须的!因为你如果你不SSH到LiveCD中,编写安装配置文件config.yaml的时候非常麻烦,比如,你要添加SSH-Key,你不可能一个一个字符敲进去,所以最好的方法当然是在SSH终端上直接拷贝。
坑:从系统上看来,SSHD服务是开着的,我链接了老半天都连不了,排查了很久才发现,在CoreOS中,和其他Linux发行版不一样,它的SSHD的PermitRootLogin默认是no的,禁止了Root登陆,所以需要改了。
配置SSH的过程
cd /etc/ssh
mv sshd_config{,.bak} #你不能直接编辑,因为这个文件是/usr/share/ssh/ssh_config的软链接,而/usr的整个分区,是只读的 cat sshd_config.bak > sshd_config
vim sshd_config #... PermitRootLogin yes #加入这一句 systemctl restart sshd
sudo passwd root
然后就可以用ssh上去了。
填写cloud-config的配置,在官方有说明,按照自己的需求来就行,在本次的实验中,这一步当然也少不了坑。
按照网上或者官方的教程,你可能会看到类似于下面这样的例子(我就是用这个的):
#cloud-config
hostname: coreos01
coreos:
units:
- name: etcd2.service
command: start - name: fleet.service
command: start etcd2:
discovery:
advertise-client-urls: http://$private_ipv4:2379,http://$private_ipv4:4001 initial-advertise-peer-urls: http://$private_ipv4:2380 listen-client-urls: http://0.0.0.0:2379,http://0.0.0.0:4001 listen-peer-urls: http://$private_ipv4:2380,http://$private_ipv4:7001 fleet:
metadata: role=coreos01 users:
- name: core
ssh-authorized-keys:
- ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAAAgQC9Q...== KeyExample
- groups:
- sudo
- docker
然而安装完之后才发现,etcd集群是失败的。经过排查,才发现etcd侦听的地址全部都是127.0.0.1
所以我果断看配置文件cat /run/systemd/system/etcd2.service/20-*,恍然大悟。
坑:在安装前配置cloud-config(cloud-config.yaml)的时候,如果要使用$private_ipv4或者其他$public_ipv4之类的变量的时候,要确保这些变量是存在的(一开始我以为CoreOS自动添加的,教程都那样写),一个方法是,你可以把环境变量写到/etc/environment中。
执行安装命令:
coreos-install -d /dev/sda -c cloud-config.yaml
由于在安装过程中,系统会从官方下载更新包,如果如我现在所看到的那样,官方的镜像站是可以直接访问的,那么你的安装过程可能很顺利。然而当时我安装的时候,镜像站是访问不了的,所以,这个坑,非GFW莫属。当然解决方法也是很简单。
坑:由于官方镜像站点被墙,安装过程中无法下载更新包。所以:
1、用某雷(VIP)或者翻墙之类的方法下载镜像
2、找到安装过程中需要下载的更新包,URL路径可以在安装脚本中找到,vim /usr/bin/coreos-install,当然还有一个更好的方式是,执行安装的时候用sh -x /usr/bin/coreos-install -d /dev/sda -c /cloud-config.yaml这样就可以看到安装的过程中脚本在哪一步停住了,比如我看到的是脚本一直停在下载下面的两个文件的步骤:
http://stable.release.core-os.net/amd64-usr/899.13.0/coreos_production_image.bin.bz2
和
http://stable.release.core-os.net/amd64-usr/899.13.0/coreos_production_image.bin.bz2.sig
3、用某雷(VIP)或者翻墙把两个文件下载下来,自己建立HTTP服务器,然后在里面简历一个899.13.0目录,并把文件放进去,供安装脚本下载。
4、执行安装,并指定从自己的http服务器下载更新包
coreos-install -d /dev/sda -c cloud-config.yaml -b http://192.168.1.1
坑:从VPS下载更新包,又传到内网HTTP服务器上,数据损坏,重新下一个,安装成功 T_T。
折腾一番之后,总算安装成功,有了一个继续折腾的平台。
总体感觉,CoreOS的设计理念是很好的,尤其是集群和精简这一点,在搭配CoreOS的几大重量级应用(fleet、etcd、Rkt等)之后,相对于传统的Linux发行版,在数据中心或者微服务架构中,简直是完爆了,我之后在测试的CoreOS上面开启docker发现其运行起来比在CentOS7运行快很多,不知道是错觉还是错觉或者是错觉...特地也在某云买了一台虚拟机来玩CoreOS。但是!由于CoreOS相对来说还是比较新的东西,所以在行业上用得比较少,尤其是国内,所以学习资料、系统架构案例和问题疑难解决方案等资料在网络上都比较少,另一方面,由于CoreOS大部分时候注重大体架构,细节上比较少关注,所以对于用户而言,会有很多小坑(体验颇深)。