Chinaunix首页 | 论坛 | 博客
  • 博客访问: 203271
  • 博文数量: 124
  • 博客积分: 7051
  • 博客等级: 少将
  • 技术积分: 1425
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-20 13:21
文章分类

全部博文(124)

文章存档

2008年(124)

我的朋友

分类: LINUX

2008-04-23 20:18:22

   

安装

   如果从Linux发布版直接安装Vim,需要注意的一点是,缺省情况下系统并不一定为你安装了一个完整的Vim。比如,在RedHat(以及后来的 FedoraCore)的发布版中,Vim被拆成了四个包:vim-common(公用部分),vim-minimal(最小安装),vim- enhanced(除XWindow支持外的完整安装),和vim-X11(XWindow图形界面支持)。最小安装不能完整展示Vim的优点,通常只是 作为vi的替代品出现,缺少很多重要的特性如多字节语言支持、鼠标支持和脚本支持。如果装了XWindow的话,图形界面的gvim也比文本模式的vim 具有更多的特性。建议大家尽可能安装完全的Vim。

   如果愿意稍稍费一点功夫,自己编译Vim的话,可以更好地定制Vim。--附带的另一个好处是,你如果发现什么错误的话,你就可以自己动手来修复这个错 误,或至少找到错误所在的位置,让Bram(Vim的作者)可以更快地解决问题。图1是在Vim中执行":version"的结果的一部分,可以看到 Vim有很多不同的特性(feature)可在编译时打开或关闭。如果自己编译的话,就可以选择打开需要的功能,关闭不需要的功能,来获得一个既功能强 大、又小巧快速的Vim定制版本。

中文支持

  Vim支持世界上的主要语言,当然也包括中文。如果你用Vim编辑中文,而中文不能正确显示,那有两种可能性:一是使用的Vim不完整,不含多字节语言支持(multi_byte特性);二是某个配置出了问题。

   说到多语言支持,最基本的概念有两个:一是文件的语言编码,而是环境的内部编码。在较老的操作系统中,不管Linux还是Windows,这两个编码都 是一样的,也就意味着,一次只能处理一种编码的文件:要么只能处理西文编码(Latin1,即ISO-8859-1[5]),要么只能处理中文编码 (GB2312[2])。而在新的操作系统中,这两者可以是不一样的。在Linux上,常见的情况是环境的内部编码使用UTF-8[6],而UTF-8可 以同任何一种语言编码作无损转换,这就保证了系统的多语言处理能力。Vim这方面秉承了Unix/Linux的传统,在内部编码使UTF-8的时候,可以 同时处理不同意语言编码的文件。

  以下列出了和语言编码的相关的设置:

环境变量LANG(使用的语言);

环境变量LC_CTYPE(使用的内部编码);

Vim选项encoding(Vim的内部编码);

Vim选项termencoding(Vim在与屏幕/键盘交互时使用的编码);

Vim选项fileencoding(Vim当前编辑的文件在存储时的编码);

Vim选项fileencodings(Vim打开文件时的尝试使用的编码);

Vim选项ambiwidth(对"不明宽度"字符的处理方式;Vim6.1.455后引入)。

   如果你的环境只需要处理简体中文的话,那么,最简单的方式就是所有的设定全部使用简体中文。只需要:设定LANG=zh_CN.GB2312,不设定 LC_CTYPE(默认跟LANG一样),不设定与编码相关的Vim选项(默认由LANG和LC_CTYPE决定),也无需设定Vim选项 ambiwidth。也就是说,我们把语言设定为中国(CN)使用的中文(zh),编码为GB2312(注意:Vim内部并不识别国标GB18030 [3],所以此处只能设GB2312;参看下面关于UTF-8的讨论)。

   不过,如果按照目前Linux下的惯例,内部编码一律使用UTF-8的话,会有一些额外的好处,其中之一就是在这种情况下Vim支持同时编辑多种不同编 码的文件,如简体中文和繁体中文(参见图2);另外,此时Vim也可以通过编码转换支持GBK[4]和GB18030了。这样,众多关于语言编码的Vim 选项就有了用武之地了。下面进一步说明一下这些选项和推荐设定(如果适用的话):

图2

       encoding=utf-8:不管文件的编码如何,不管如何显示和输入,Vim内部使用的编码是UTF-8;这是国际化支持的基础。

termencoding: 取决于实际的终端或XWindow的设定。举例来说,如果选择语言简体中文登录到XWindow,或者正在使用CXTERM[10]的话,那么该选项应被 设为GB2312;如果使用缺省的语言(LANG=en_US.UTF-8)登录到XWindow,或者使用PuTTY[11]远程访问Linux机器、 并且设定里的字符编码(配置中Window-Translation)设为UTF-8的话,该选项就应该设为utf-8。从Windows下使用 PuTTY远程连接Linux的请特别注意,测试表明,仅在使用UTF-8的情况下,PuTTY才能可靠地支持中文的显示和输入(显示字体必须设成中文字 体)。

fileencoding: 文件载入时,该选项被置为Vim认定的文件编码,因此,存储时文件的编码不会改变。此处和下面fileencodings可使用的编码为libiconv 支持的所有几百种编码(如果编译时包含了iconv特性的话),与中文相关的有gb2312、gbk、gb18030、hz-gb-2312、iso- 2022-cn、big5、cp936、cp950等。如果创建新文件,你又不希望使用UTF-8作为文件编码时,那么,你可能需要手工设定该选项,如 ":setfileencoding=gb2312"。需要注意的一点是,使用"set"来设定该选项的话会改变以后新建文件的缺省编码,而使用 "setlocal"的话则只影响当前文件(参考":help setlocal")。fileencodings=ucs-bom,utf-8,chinese:Vim会首先判断文件的开头是否是一个Unicode [7]的BOM(byte ordermark)字符[8],是的话则把文件的其余内容解释成相应的Unicode序列;否的话再试图把文件内容解释成UTF-8的序列;再失败的 话,则把文件解释为简体中文(chinese是一个跨平台的简体中文字符集的别名,Linux下相当于gb2312和euc-cn;此处也可以根据需要以 gb2312、gbk或gb18030等编码替代)。需要注意的是,该顺序不能颠倒,并且在后面再添加其它编码如big5、latin1也是没有意义的, 因为Vim不能识别8比特编码中的错误,因此这些编码后列的编码永远不会被用到。

ambiwidth =double:把所有的"不明宽度"字符[9]--指的是在Unicode字符集中某些同时在东西方语言中使用的字符,如省略号、破折号、书名号和全角 引号,在西方文字中通常字符宽度等同于普通ASCII字符,而在东方文字中通常字符宽度等同于两倍的普通ASCII字符,因而其宽度"不明"--的宽度置 为双倍字符宽度(中文字符宽度)。此数值只在encoding设为utf-8或某一Unicode编码时才有效。需要额外注意的是,如果你通过终端使用 Vim的话,需要令终端也将这些字符显示为双宽度。比如,XTERM[12]的情况下应该使用选项"-cjk",即使用命令"uxterm-cjk"来启 动使用双宽度显示这些字符的UnicodeX终端;使用PuTTY远程连接的话则应在配置的Window-Translation中选中 "TreatCJK ambiguous characters as wide"(参见图3)。

图3

需要设定的选项通常放在用户的Vim资源配置文件中,即在~/.vimrc文件中加入:

set encoding=utf-8set fileencoding=chinesesetfileencodings=ucs-bom,utf-8,chineseset ambiwidth=double

   如果想进一步了解这些选项的话,可以使用":help'选项'"查看帮助文档中的相关(英文)信息。帮助中也可以查到这些选项(以及命令)的缩写:本文 中为方便理解,除一些极少有人使用完整拼写的命令如":e(dit)"、":s(ubstitute)"等之外,一般使用完整拼写而不说明或使用缩写。关 于配置文件.vimrc,可以使用":help.vimrc"查看相关信息。

  在使用内部编码UTF-8的情况下,如需编辑fileencodings之外(其不能自动识别)的文件,则可以使用以下命令:":e++enc=编码 文件名"。详情可参考":help ++enc"。

  鼠标支持

   不管是文本界面还是图形界面的Vim,都支持鼠标。不过,在文本界面中,鼠标支持缺省没有被激活;这就意味着,在终端上使用鼠标,所有的功能仍和没有使 用Vim时相同,并不受Vim影响。要激活文本界面中的鼠标支持也很容易,只需要执行一句":set mouse=a"即可。

  启用了鼠标支持之后,Vim主要支持的鼠标操作有:

单击移动光标到点击的位置;

在帮助的关键字上双击显示该关键字相关的帮助信息;

在普通文本上双击选中点击位置的单词;

拖动鼠标选中文本;

使用鼠标滚轮滚动当前缓冲区中的文本;

多窗口编辑时可以拖动窗口分栏的位置。

  进一步的信息可参看":help 'mouse'"、":help mouse-using"和":helpscroll-mouse-wheel"。

         特别需要值得一提的是,在远程访问Linux系统时也是可以使用鼠标的。如果使用XWindow系统,自然不必说;而使用SSH远程连接时,大部分 Linux下的终端客户程序,如XTERM、GNOME-Terminal[13]、较新版本的Konsole[14],以及Windows下的 PuTTY,支持鼠标的使用:你只需简单地启动Vim、执行一句":setmouse=a"就可以了(当然,也可以把上面的语句去掉起始的冒号放到. vimrc文件中)。

  空格、制表符和缩进

   对于编写代码,缩进是最基本的概念之一。至于缩进是使用空格还是制表符(Tab),或者缩进是否正好使用一个制表符来表示,很多程序员,特别是 Windows开发出身的程序员,很容易混淆。幸好,Vim对于这些概念有非常完整的支持,足以应付各种复杂的情况。以下是相关的主要Vim选项:

shiftwidth(缩进的空格数);

tabstop(制表符的宽度);

expandtab(是否在缩进和遇到Tab键时使用空格替代;使用noexpandtab取消设置);

softtabstop(软制表符宽度,设置为非零数值后使用Tab键和Backspace时光标移动的格数等于该数值,但实际插入的字符仍受tabstop和expandtab控制);

autoindent(自动缩进,即每行的缩进值与上一行相等;使用noautoindent取消设置);

cindent(使用C语言的缩进方式,根据特殊字符如"{"、"}"、":"和语句是否结束等信息自动调整缩进;在编辑C/C++等类型文件时会自动设定;使用nocindent取消设置);

cinoptions(C语言缩进的具体方式,请参考":helpcinoptions-values");

paste(粘贴模式,会取消所有上述选项的影响来保证后面的操作--通常是从剪贴板粘贴代码--保持原有代码的风格;使用nopaste取消设置)。

  下面给出一些常用的组合:

shiftwidth=4tabstop=4:很多Windows出身的程序员会习惯这样的设置,让缩进等于制表符宽度。

shiftwidth=4tabstop=8:很多Unix程序员的设置,仍使用较常用的4格缩进,但制表符宽度为标准的8。

cinoptions =>4,n-2,{2,^-2,:2,=2,g0,h2,p5,t0,+2,(0,u0,w1,m1shiftwidth=2tabstop=8: 标准的GNU编码风格的设置,对Vim缺省的C缩进风格作了很多微调,比如,if语句下的"{"、"}"要在"if"后缩进两格,但函数定义部分"{"、 "}"仍和函数名一行对齐。开源软件经常使用该种缩进风格。

   在编辑代码时一个很有用的命令是调整代码缩进,可以很方便地增加(或减少)若干级缩进,并自动根据选项设定使用正确的空格或制表符。只需要使用"V"选 中你要调整的代码行,然后键入"<"(或">")即可增加(或减少)一级缩进;在键入"<"(或">")之前键入数字则可以指定 增加(或减少)的缩进级数。

        我们要讨论的最后一个相关的命令是":retab"。在设定了expandtab选项时,该选项会把所有的制表符转换成空格。在没有设定 expandtab选项时,使用":retab!"可把空白字符转换成制表符(可能误转换,慎用),使用":retabn"可以把tabstop重置为 n,并转换含制表符的连续空白字符为适当的制表符和空格的组合以保证含制表符的行看起来没有任何变化。详细信息请参看":help :retab"。

  模式行(modeline)

   没人愿意每次都手工输入一大堆的Tab和缩进设定。可是,放在.vimrc文件中似乎也不是个好主意:如果我编辑的代码不止一种风格呢?--考虑一下, 如果你参加开源软件项目,你能保证你参加的所有项目,还有你公司里的软件项目,代码风格都一样吗?--Vim是我用过的第一个支持在文件中记录代码风格设 定的编辑器。这个特性在Vim中叫做模式行,实际上,它所做的是在打开文件时根据文件中的Vim指令设定相关的Vim选项。下面就是一个嵌在C源代码中的 模式行:

/* vim: set tabstop=4 shiftwidth=4 expandtab: */

   模式行有好几种形式。本文只介绍上面的这种形式(其它形式类似,请自行参考":helpmodeline"):行首的"/*"和尾部的"*/"告诉C编 译器这是一行注释,不是代码的一部分;而Vim可通过后面的"vim:"识别出模式行的开始(必须出现在行首或前面有一个空白字符);后面则是"set" 和空格间隔开的一串Vim选项;":"表示模式行结束。

  这种方式非常简单,功能也非常强大。另外请注意,出于安全的考虑,模式行中的选项只影响当前文件(":helpmodeline-local"),也不能做任何设置选项以外的工作。

  寄存器

   通常的编辑器有一个剪贴板,以存储复制和剪切的内容。Vim中的类似概念叫做寄存器(register)。除了有一个无名寄存器外,Vim还有一大堆有 名的寄存器,可以通过"""(参见":help"")或"Ctrl-R"(参见":help i_CTRL-R"和":helpc_CTRL-R")加寄存器名(字母、数字和某些特殊字符,参见":helpregisters";"无名"寄存器的 名字是""")来访问。比如,你先使用""ayy"复制了一行,然后使用"dd"删掉了一行,然后移动光标到要复制到的位置,就可以使用""aP"把先前 复制的内容粘贴上去了。手工编辑是有名寄存器的作用还不是很大,但当你想让Vim通过类似于宏的方式自动完成工作时,有名寄存器就变成不可缺少的重要功能 了。下面我们还会用到。

在 使用XWindow系统时,有两个特殊的寄存器是需要注意一下的:""*"访问的寄存器是X的主选择区域(primaryselection),""+" 访问的寄存器是X的剪贴板(clipboard)。如果你要在Vim和其它的X应用程序之间复制文本内容,你可以试一下这两个寄存器。

  还有一个很特殊的"寄存器":"="。在插入模式或命令模式中,键入"Ctrl-R=",Vim会提示你输入一个表达式,普通的整数运算在此完全有效。如果想要进行浮点运算,请参见第3.2节中的技巧。

  搜索、替换和正则表达式

   大家应该都已经知道Vim里使用"/模式"(或"?模式")进行搜索,使用":s/模式/字符串/标志"进行替换,其中的"模式"是一个正则表达式。关 于正则表达式,不熟悉的话可以边用边学,本节也不打算对Vim的正则表达式作完整的阐述(那可能可以专门写一本小册子了),而只抛砖引玉式地给出一些有用 的例子加以说明,以及一些实用技巧。

   先说一点点搜索。搜索里最最有用的一个快捷方式是"*"(向下完整匹配光标下的单词)。把光标移动到你要搜索的词(变量名、函数名等)上,比如 "test",然后按"*",Vim将自动产生一个对"\"(参见":help/\<"和":help/\>")的搜索,也就是说,搜索完整 的单词"test"。不要小看这个技巧,它经常可以大幅度地提高搜索的速度。事实上,这是Vim网站上公布的第1号技巧,也是被评价最高的技巧。相似的技 巧还有"#" (向上完整匹配光标下的单词)、"g*"(向下部分匹配光标下的单词)等,请自行查看(":help #"等)。

   Vim在搜索和替换时会对匹配成功的文本进行加亮,在已经完成搜索和替换任务后,这种加亮有时反而会妨碍显示。Vim专门提供一个命令取消这种加亮(直 到用户再一次使用搜索或替换命令):":nohlsearch"。建议用户创建一个键盘映射(keymapping)加入到.vimrc中,如:

nmap  :nohlsearch

  以上命令表示,在正常模式下按F2键相当于输入":nohlsearch"后面跟一个回车,即取消搜索加亮显示。

再看几个搜索替换的实用例子。

去 掉所有的行尾空格:":%s/\s\+$//"。"%"表示在整个文件范围内进行替换,"\s"表示空白字符(空格和制表符),"\+"对前面的字符匹配 一次或多次(越多越好),"$"匹配行尾(使用"\$"表示单纯的"$"字符);被替换的内容为空;由于一行最多只需替换一次,不需要特殊标志。这个还是 比较简单的。

去掉所有 的空白行:":%s/\(\s*\n\)\+/\r/"。这回多了"\("、"\)"、"\n"、"\r"和"*"。"*"代表对前面的字符(此处为"\ s")匹配零次或多次(越多越好;使用"\*"表示单纯的"*"字符),"\n"代表换行符,"\r"代表回车符,"\("和"\)"对表达式进行分组, 使其被视作一个不可分割的整体。因此,这个表达式的完整意义是,把连续的换行符(包含换行符前面可能有的连续空白字符)替换成为一个单个的换行符。唯一很 特殊的地方是,在模式中使用的是"\n",而被替换的内容中却不能使用"\n",而只能使用"\r"。原因是历史造成的,详情如果有兴趣的话可以查看": helpNL-used-for-Nul"。

去 掉所有的"//"注释:":%s!\s*//.*!!"。首先可以注意到,这儿分隔符改用了"!",原因是在模式或字符串部分使用了"/"字符,不换用其 他分隔符的话就得在每次使用"/"字符本身时写成"\/",上面的命令得写成":%s/\s*\/\/.*//",可读性较低。命令本身倒是相当简单,用 过正则表达式的人估计都知道"."匹配表示除换行符之外的任何字符吧。

去 掉所有的"/* */"注释:":%s!\s*/\*\_.\{-}\*/\s*!!g"。这个略有点复杂了,用到了几个不太常用的Vim正则表达式特性。"\_."匹配 包含换行在内的所有字符;"\{-}"表示前一个字符可出现零次或多次,但在整个正则表达式可以匹配成功的前提下,匹配的字符数越少越好;标志"g"表示 一行里可以匹配和替换多次。替换的结果是个空格的目的是保证像"int/* space not necessary around comments*/main()"这样的表达式在替换之后仍然是合法的。

  希望上面的这些简单的例子能够引起你使用Vim的正则表达式高效完成任务的兴趣。进一步的信息可参考":helpregexp"。

自动完成和路径设定

   Vim支持单词的自动完成。比如,你前面使用了一个很长的变量名,叫aLongVariable,下面你在输入时,就不用完整键入了。很可能,你只需要 键入"aL",然后按下"Ctrl-P"(向前搜索可匹配的单词并完成)就可以得到完整的变量名(没有得到想要的结果的话,多按几下"Ctrl-P";或 者前面多输入几个字符,如"aLongV")。类似的命令还有"Ctrl-N"(向后搜索可匹配的单词并完成)、"Ctrl-XCtrl-L"(搜索可匹 配的行并完成)、"Ctrl-XCtrl-F"(搜索可匹配的文件名并完成)等,具体可参看":helpins-completion"。

如果你并不熟悉这些功能,但也并不觉得这有什么稀奇的话,下面这个例子可能会让你觉得吃惊。请尝试打开一个空白的C文件(vimtest.c),并输入:

#i nclude intmain(){   pri

   最后一行不要回车,直接在"pri"后面输入"Ctrl-P",你将看到"printf"出现。是的,虽然文件里没有"printf",但Vim知道到 哪里去寻找它!在作关键字匹配完成时,如果当前文件和其它打开的文件中没有想要的结果,Vim会自动到"#include"的文件中进行进一步的搜索(为 什么是"#include"呢?请查阅":help'include'"),搜寻的目录则由选项path决定,其缺省值在Unix(含Linux)下为 ".,/usr/include,,",代表搜索的目录依次是文件所在目录、/usr/include和当前目录。根据实际情况,你可能需要在. vimrc文件中设置该选项,加入项目相关的包含目录,注意一般要保留最后的",,",除非你不需要在当前目录下搜索。

   设置了合适的path后,另外带来的一个便利就是可以使用"gf"命令方便地跳转到光标下的文件名所代表的文件中。在上面的例子中,把光标移到 "stdio.h"的任一字符上,键入"gf",则Vim会自动打开/usr/include/stdio.h文件。使用"Ctrl-O"(参见": helpCTRL-O")可返回到原先的文件中。

阅读(282) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~