分类: 项目管理
2010-03-19 19:14:01
在过去几年,对于分布式版本控制可以给开发过程提供的益处有许多争论。最近,分布式工具已经很成熟了。尽管分布式工具的一些 优点最初可能不明显,但是从长期来看,它们提供的灵活性是非常有意义的。阅读完本文之后,您应该能够开始使用分布式版本控制系统,基本了解分布式模型能够 提供的优点。
围绕分布式版本控制的争论主要集中在不再需要的中心服务器。这是一个非常独特的特性,对于一些开发人员组很重要,但是 它的真正价值在于,它允许开发人员组实现他们选择的几乎任何工作流。它能够完成很多事情,比如传统的集中式模型,或两个开发人员在咖啡馆通过无线连接协同 工作,等等。
允许开发人员以各种新的方式工作,这是分布式版本控制真正令人兴奋的特点。实际上,在本文末尾会介绍如何实现这样的“咖啡馆”工作流。这对于作家、学校教师和 Linux® 内核开发人员都有益处。
什么是分布式版本控制?
分布式版本控制 (DVCS) 是一种不需要中心服务器的管理文件版本的方法,但是它也可以使用中心服务器。更改可以被合并到 DVCS 的任何其他用户的系统中,因此可以实现非常灵活的工作流。
DVCS 的两个主要优点是:它比集中的版本控制更灵活,因为它除了支持传统的(集中式)工作流,还支持其他各种工作流;它比集中式服务器快得多,因为大多数操作在客户机本地进行,而不需要网络操作。
DVCS 和集中式版本控制系统的主要差异
在 DVCS 和集中式版本控制系统之间有三个关键差异。第一个差异是,DVCS 通过本地提交支持离线工作,这是由 DVCS
的操作方式决定的。这与集中式版本控制完全不同,集中式版本控制要求通过到中心服务器的连接执行所有操作。这种灵活性让开发人员在飞机上也能够像在办公室
中一样轻松地工作,可以一次又一次地进行提交。
第二个差异是 DVCS 比集中式系统更灵活,因为 DVCS 支持许多不同类型的工作流,从传统的集中式工作流到纯粹的特殊工作流,再到特殊工作流和集中式工作流的组合。这种灵活性允许通过电子邮件、对等网络和开发团队喜欢的任何方式进行开发。
第三个差异是 DVCS 比集中式版本控制系统快得多,因为大多数操作在客户机上进行,速度非常快。另外,在需要进行推(push )操作(与另一个节点通信)时,速度也更快,因为两个客户机机器上都有完整的元数据。速度差异相当显著,根据使用本地存储库还是网络存储库,DVCS 比 Subversion 快大约 3-10 倍。
分布式版本控制工作流
因为 DVCS 非常灵活,可以实现各种各样的工作流,但是由于篇幅有限,本文只讨论两种工作流。首先讨论最常用的工作流之一 Partner 工作流。按照 Partner 工作流,一个开发人员启动一个项目,然后进行分支。然后,在不同开发人员工作的分支之间来回合并更改。
第二种常用 的工作流是通过本地提交使用集中式服务器。在这种工作流中,开发人员的工作方式与使用集中式 subversion 存储库时非常相似,但是他们进行本地提交,然后把最终更改推到集中式服务器。这种工作流有许多变体,包括与 Partner 工作流结合使用。重要的是,可以采用许多种工作方式,通过使用 DVCS,可以灵活地选择最适合自己的工作方式。
快速入门指南
了解一种新技术的最好方法之一是实际使用它。在本节中,简要介绍 Mercurial、Bazaar 和 Git 中的常用操作,您可以试试这些操作:
Mercurial
安装:sudo easy_install-2.5 mercurial
建立项目目录:mkdir hgrepo; cd hgrepo
初始化项目:hg init
添加文件:touch foo.txt; hg add foo.txt
提交:hg commit -m "added foo.txt" commit
抓取共享的存储库:hg clone ssh://example.com//projects/hgrepo
本地提交更改:hg -ci -m "adding a change"
把更改推到服务器:hg push
以补丁形式查看未处理的更新:hg incoming -p
从服务器下载更新:hg pull
应用更改:hg update
合并冲突:hg merge
合并两个不相关的远程存储库:hg pull -f ssh://example2.com//projects/hgrepo
Bazaar
安装:sudo easy_install-2.5 bzr
建立项目目录:mkdir bzrrepo; cd bzrrepo
初始化项目:bzr init
添加文件:touch foo.txt; bzr add foo.txt
提交:bzr commit -m "added foo.txt" commit
抓取共享的存储库:bzr branch bzr+ssh://example.com/projects/gitrepo
本地提交更改:bzr -ci -m "adding a change"
把更改推到服务器:bzr push
从服务器下载更新:bzr pull
应用更改:bzr update
合并冲突:bzr merge
Git
安装:下载最新的 tar 文件
建立项目目录:mkdir gitrepo; cd gitrepo
初始化项目:git init
添加文件:touch foo.txt; git add foo.txt
提交:git commit -m "added foo.txt" commit
抓取共享的存储库:git clone ssh://example.com/projects/bzrrepo
本地提交更改:bzr -ci -m "adding a change" commit
把更改推到服务器:bzr push
从服务器下载更新:bzr pull
应用更改:bzr update
合并冲突:bzr merge
转换工具和与 subversion 的集成
这三种 DVCS 都能够把现有的 subversion 存储库轻松地转换为各自的格式,甚至可以在不同的 DVCS 之间进行转换。这使开发人员能够方便地试用 DVCS 或从一种 DVCS 转移到另一种 DVCS。
例如,对于 Mercurial,可以使用工具 hgimportsvn 和 hgpullsvn 与现有的 subversion 存储库通信,创建新的 hg 存储库和历史。tailor 工具是一种通用的存储库转换工具。
另一种有意思的试用方法是集成 DVCS 与现有的 subversion 存储库。对这种方法的详细讨论超出了本文的范围,但是 参考资料 给出了一些工具的链接,这些工具可以在 subversion 分支与 Git、Bazaar 和 Mercurial 之间进行双向操作。
第三方托管选项
如果开放源码或商业开发人员不希望或不需要管理自己的集中式 “集线器”,那么可以选用流行的托管站点托管自己的 Git、Bazaar 或 Mercurial 项目。对于 Mercurial,流行的免费和付费托管站点是 Bitbucket。对于 Git,可以使用 Github;对于 Bazaar,可以使用由 Canonical 发起的 Launchpad。
提示:“咖啡馆” Mercurial 工作流
图 1. 咖啡馆工作流
如果希望实现安全的特殊版本控制工作流,让两个开发人员可以在咖啡馆中通过无线网络一起工作,那么可以试试下面的方法。
第一个用户使用 Mercurial 创建一个存储库:
mkdir /tmp/myhgrepo
cd /tmp/myhgrepo
hg init
然后,通过 Web 作为只读共享共享它:
hg serve
第二个用户使用以下命令克隆这个存储库:
hg clone
注意:这是另一台机器的 IP 地址或本地主机名。在 OS X 上,可以通过对 your-machine-name.local 使用 Bonjour 获得这一信息。
第二个用户进行他需要的更改,然后作为只读的 HTTP 共享提供他的存储库:
第一个用户对第二个用户的存储库拷贝执行 hg 拖操作:
hg clone
每个开发人员都是安全的,因为他们只在需要更新自己的本地文件系统时才对对方的存储库进行拖操作。
结束语
本文讨论了分布式版本控制能够提供的价值,比较了三种主流工具 Git、Mercurial 和 Bazaar 之间的差异。如果您不太熟悉版本控制,那么应该继续学习版本控制、钩子和插件以及它们能够提供的功能。
如果您是老手,那么应该试试这些工具,寻找最适合自己的工具。请通过 参考资料 中的链接详细了解各种分布式版本控制系统以及别人的使用经验。