分类: 项目管理
2010-03-19 19:04:17
2009 年 5 月 25 日
您是否对分布式版本控制感兴趣,但是又被一大堆行话弄糊涂了?本文介绍三种主要的系统(Git、Mercurial 和 Bazaar),讨论采用分布式工作流的一些优点,比较分布式版本控制的常用操作。
在过去几年,对于分布式版本控制可以给开发过程提供的益处有许多争论。最近,分布式工具已经很成熟了。尽管分布式工具的一些优点最初可能不明显,但是从长 期来看,它们提供的灵活性是非常有意义的。阅读完本文之后,您应该能够开始使用分布式版本控制系统,基本了解分布式模型能够提供的优点。
围绕分布式版本控制的争论主要集中在不再需要的中心服务器。这是一个非常独特的特性,对于一些开发人员组很重 要,但是它的真正价值在于,它允许开发人员组实现他们选择的几乎任何工作流。它能够完成很多事情,比如传统的集中式模型,或两个开发人员在咖啡馆通过无线 连接协同工作,等等。
允许开发人员以各种新的方式工作,这是分布式版本控制真正令人兴奋的特点。实际上,在本文末尾会介绍如何实现这样的“咖啡馆”工作流。这对于作家、学校教师和 Linux® 内核开发人员都有益处。
分布式版本控制 (DVCS) 是一种不需要中心服务器的管理文件版本的方法,但是它也可以使用中心服务器。更改可以被合并到 DVCS 的任何其他用户的系统中,因此可以实现非常灵活的工作流。
DVCS 的两个主要优点是:它比集中的版本控制更灵活,因为它除了支持传统的(集中式)工作流,还支持其他各种工作流;它比集中式服务器快得多,因为大多数操作在客户机本地进行,而不需要网络操作。
|
在 DVCS 和集中式版本控制系统之间有三个关键差异。第一个差异是,DVCS 通过本地提交支持离线工作,这是由 DVCS 的操作方式决定的。这与集中式版本控制完全不同,集中式版本控制要求通过到中心服务器的连接执行所有操作。这种灵活性让开发人员在飞机上也能够像在办公室 中一样轻松地工作,可以一次又一次地进行提交。
第二个差异是 DVCS 比集中式系统更灵活,因为 DVCS 支持许多不同类型的工作流,从传统的集中式工作流到纯粹的特殊工作流,再到特殊工作流和集中式工作流的组合。这种灵活性允许通过电子邮件、对等网络和开发团队喜欢的任何方式进行开发。
第三个差异是 DVCS 比集中式版本控制系统快得多,因为大多数操作在客户机上进行,速度非常快。另外,在需要进行推(push )操作(与另一个节点通信)时,速度也更快,因为两个客户机机器上都有完整的元数据。速度差异相当显著,根据使用本地存储库还是网络存储库,DVCS 比 Subversion 快大约 3-10 倍。
|
因为 DVCS 非常灵活,可以实现各种各样的工作流,但是由于篇幅有限,本文只讨论两种工作流。首先讨论最常用的工作流之一 Partner 工作流。按照 Partner 工作流,一个开发人员启动一个项目,然后进行分支。然后,在不同开发人员工作的分支之间来回合并更改。
第二种常用的工作流是通过本地提交使用集中式服务器。在这种工作流中,开发人员的工作方式与使用集中式 subversion 存储库时非常相似,但是他们进行本地提交,然后把最终更改推到集中式服务器。这种工作流有许多变体,包括与 Partner 工作流结合使用。重要的是,可以采用许多种工作方式,通过使用 DVCS,可以灵活地选择最适合自己的工作方式。
|
了解一种新技术的最好方法之一是实际使用它。在本节中,简要介绍 Mercurial、Bazaar 和 Git 中的常用操作,您可以试试这些操作:
sudo easy_install-2.5 mercurial
mkdir hgrepo; cd hgrepo
hg init
touch foo.txt; hg add foo.txt
hg commit -m "added foo.txt" commit
hg clone ssh://example.com//projects/hgrepo
hg -ci -m "adding a change"
hg push
hg incoming -p
hg pull
hg update
hg merge
hg pull -f ssh://example2.com//projects/hgrepo
sudo easy_install-2.5 bzr
mkdir bzrrepo; cd bzrrepo
bzr init
touch foo.txt; bzr add foo.txt
bzr commit -m "added foo.txt" commit
bzr branch bzr+ssh://example.com/projects/gitrepo
bzr -ci -m "adding a change"
bzr push
bzr pull
bzr update
bzr merge
mkdir gitrepo; cd gitrepo
git init
touch foo.txt; git add foo.txt
git commit -m "added foo.txt" commit
git clone ssh://example.com/projects/bzrrepo
bzr -ci -m "adding a change" commit
bzr push
bzr pull
bzr update
bzr merge
|
这三种 DVCS 都能够把现有的 subversion 存储库轻松地转换为各自的格式,甚至可以在不同的 DVCS 之间进行转换。这使开发人员能够方便地试用 DVCS 或从一种 DVCS 转移到另一种 DVCS。
例如,对于 Mercurial,可以使用工具 hgimportsvn 和 hgpullsvn 与现有的 subversion 存储库通信,创建新的 hg 存储库和历史。tailor 工具是一种通用的存储库转换工具。
另一种有意思的试用方法是集成 DVCS 与现有的 subversion 存储库。对这种方法的详细讨论超出了本文的范围,但是 参考资料 给出了一些工具的链接,这些工具可以在 subversion 分支与 Git、Bazaar 和 Mercurial 之间进行双向操作。
|
如果开放源码或商业开发人员不希望或不需要管理自己的集中式 “集线器”,那么可以选用流行的托管站点托管自己的 Git、Bazaar 或 Mercurial 项目。对于 Mercurial,流行的免费和付费托管站点是 Bitbucket。对于 Git,可以使用 Github;对于 Bazaar,可以使用由 Canonical 发起的 Launchpad。
|
如果希望实现安全的特殊版本控制工作流,让两个开发人员可以在咖啡馆中通过无线网络一起工作,那么可以试试下面的方法。
第一个用户使用 Mercurial 创建一个存储库:
mkdir /tmp/myhgrepo |
然后,通过 Web 作为只读共享共享它:
hg serve |
第二个用户使用以下命令克隆这个存储库:
hg clone |
注意:这是另一台机器的 IP 地址或本地主机名。在 OS X 上,可以通过对 your-machine-name.local 使用 Bonjour 获得这一信息。
第二个用户进行他需要的更改,然后作为只读的 HTTP 共享提供他的存储库:
第一个用户对第二个用户的存储库拷贝执行 hg 拖操作:
hg clone |
每个开发人员都是安全的,因为他们只在需要更新自己的本地文件系统时才对对方的存储库进行拖操作。
|
本文讨论了分布式版本控制能够提供的价值,比较了三种主流工具 Git、Mercurial 和 Bazaar 之间的差异。如果您不太熟悉版本控制,那么应该继续学习版本控制、钩子和插件以及它们能够提供的功能。
如果您是老手,那么应该试试这些工具,寻找最适合自己的工具。请通过 参考资料 中的链接详细了解各种分布式版本控制系统以及别人的使用经验。
是 O'Reilly 出版的 一书的合著者,并且现在还在为 Manning 编著 一书。他是一名作家、演说家、顾问和社区负责人,并为 IBM developerWorks、、 和 撰稿。他的咨询公司的网站是 ,他的个人网站是 。 Noah 拥有加州洛杉矶的 CIS 的硕士学位,加州 Poly San Luis Obispo 的营养科学学士学位,他还是通过 Apple 和 LPI 认证的系统管理员,他曾经在许多公司工作过,如加利福尼亚理工学院、Disney Feature Animation、Sony Imageworks 和 Turner Studios。他目前在新西兰的 工作。在空闲的时候,他喜欢和妻子 Leah 以及他们的儿子 Liam 一起度过,谱写钢琴曲、参加马拉松比赛以及积极地参与体育活动。 |
Adam 在上世纪 90 年代建立了新西兰的首批 ISP 之一,自此之后他一直担任系统管理员和团队负责人。1997 年,他移居美国并在 8 年时间里在多家 dot-com 公司担任系统管理员和团队负责人,包括世界上最大的 ISP 之一。在 2000 年,他建立了一个非盈利组织,致力于与本地社区合作提供免费的无线 Internet。最近,他搬回到新西兰,管理 Peter Jackson 的视觉效果公司 Weta Digital 的基础设施团队。 |