Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1786308
  • 博文数量: 413
  • 博客积分: 8399
  • 博客等级: 中将
  • 技术积分: 4325
  • 用 户 组: 普通用户
  • 注册时间: 2011-06-09 10:44
文章分类

全部博文(413)

文章存档

2015年(1)

2014年(18)

2013年(39)

2012年(163)

2011年(192)

分类: LINUX

2012-02-25 21:30:18

Python 在近年来的受欢迎程度剧增,部分原因在于该语言非常灵活,同时功能非常强大。Python 可用于系统管理、Web 开发、GUI 编程、科学计算等等。本文的主要目标是向习惯于使用 Bash、PHP 或其它某种语言编写脚本过程代码的人介绍面向对象的 Python 开发,并帮助他们转换到面向对象的 Python 开发。Python 的这种日益流行性意味着,对于目前使用其他编程语言的开发人员,除了使用他们最喜欢的语言之外,他们还可以采用 Python 来完成某些项目。

过程式编程当然有其用武之地,并且可能是解决某个问题的高度有效的方法。在非常基本的层次上,过程式编程可定义为指令的列表,Bash 和 PHP 通常就是以这样的方式编写的。然而由于 Python 的流行,对于作为 Web 开发人员或系统管理员的 PHP 和 Bash 脚本编写人员,他们正陷入必须同时学习面向对象的编程和 Python 的境地。

面向对象这个概念很难一次性地掌握,因此本文采用过程式 Bash 和 PHP 脚本,并首先将它们转换为过程式 Python。作为最后一步,它们将转换为面向对象的 Python 这个终结目标。本文在结束时将简略讨论一下面向对象的 Python 的一些优点,然后在最后讨论一些可能更适合采用过程或函数式编程的一些不利场景。到本文结束时,Bash 或 PHP 程序员应该能够毫无畏惧地一头扎进面向对象的 Python 项目。


下面让我们看一下如何在 Bash 函数中完成同样的事情。在 Bash 中,该问题要容易解决得多,因为您实际上是在处理系统调用。在此示例中,您甚至不需要使用数组或正则表达式库,因为使用到 grep 的管道容易多了。不过,在 Bash 中设置函数的缺省参数始终有点麻烦。


#!/usr/bin/env bash
 #function flags disk usage takes pattern and message optionally
 
function disk_space () {
       #checks for pattern parameter
       if [ "$1" != "" ]; then
           pattern=$1
       else pattern="2[0-9]%"
       fi

       #checks for message parameter
       if [ "$2" != "" ]; then
            message=$2
      else
            message="CAPACITY WARNING:"
       fi

        #looks at output for pattern to flag
        output_lines=`df -h | grep $pattern`
        if [ "$output_lines" != "" ]; then
             echo $message $output_lines
       fi
}
#example of optional parameters usage
#disk_space 9[0-9]% ALERT:
 disk_space

当您运行此脚本时,将会获得同样的输出,因此可以跳过输出的显示。您能够从该脚本的 PHP 版本和 Bash 版本中找到的相关性在于,此过程式代码事实上像一组指令一样运行。似乎计算机就像是一个小孩,而您告诉该小孩如何做某件事情,例如第一次系鞋带。在您开始在 Python 中考虑“面向对象范式”之前,让我们首先看一下如何采用 Python 来创建这同一个脚本的过程式版本。

  1. #!/usr/bin/env python
  2. #--coding:utf-8--

  3. from subprocess import Popen, PIPE
  4. import re

  5. def disk_space(pattern="8[0-9]%", message="CAPACITY WARNING:"):
  6.     
  7.     # takes shell command output
  8.     ps = Popen("df -h", shell=True, stdout=PIPE, stderr=PIPE)
  9.     output_lines = ps.stdout.readlines()
  10.     
  11.     for line in output_lines:
  12.         line = line.strip()
  13.         #print line
  14.         if re.search(pattern, line):
  15.             print "%s %s" % (message, line)


  16. disk_space()

浏览一下我们的代码的过程式 Python 版本,发现它与 Bash 和 PHP 版本非常相似。对于 Python,子过程模块处理对 Shell 命令的系统调用,并将输出发在一个列表(在 Bash 和 PHP 中称为数组)中。与 PHP 版本非常相似,然后我对命令的标准输出行列表中的项进行了迭代遍历。我寻找构成所寻找模式的正则表达式,然后使用注入的特殊消息来打印该磁盘报告行。这是如何解决自顶向下的脚本问题的经典示例,但是在下一个部分中,您将完全改变这种方法,并从对象的角度考虑问题。

过程式编程通常是初学的开发人员的最自然编程风格,并且对于许多问题来说也是高度有效的。另一方面,对于创建抽象从而创建可重用的代码来说,面向对象的编程可能是非常有用的方法。然而,当项目达到某种程度的复杂性之后,过程代码通常会暴露出其根本缺陷。下面让我们直接进入上一个示例的面向对象版本,并看看这样有何变化。

  1. #/usr/bin/env python

  2. from subprocess import Popen, PIPE
  3. import re

  4. class DiskMonitor(object):
  5.     """Disk Monitoring class"""
  6.     def __init__(self, pattern="5[0-9]%",
  7.                 message="CAPACITY WARNING",
  8.                 cmd = "df -h"):
  9.         self.pattern = pattern
  10.         self.message = message
  11.         self.cmd = cmd

  12.     def disk_space(self):
  13.         """Disk space capacity flag method"""
  14.         ps = Popen(self.cmd, shell=True, stdout=PIPE, stderr=PIPE)
  15.         output_lines = ps.stdout.readlines()
  16.         for line in output_lines:
  17.             line = line.strip()
  18.             if re.search(self.pattern, line):
  19.                 print "%s %s" % (self.message, line)

  20. if __name__ == "__main__":
  21.     d = DiskMonitor()
  22.     d.disk_space()

查看该代码的面向对象版本,可以看到代码变得更加抽象。有时,太多的抽象会导致设计问题,但是在此例中,它允许您将问题分离为更多可重用的部分。DiskMonitor 类具有 __init__ method,您可以在其中定义新的参数,并且 disk_space 函数现在是该类中的一个方法。

使用这种新的样式,您无需更改原始代码即可容易地重用和自定义各个部分,而使用过程代码时则通常必须更改原始代码。面向对象的设计的一个更加功能强大、通常也被过度使用的方面是继承。继承允许您在新的类中重用和自定义现有的代码。让我们在下一个示例中看看继承可能像什么样子。


  1. #/usr/bin/env python
  2. #--coding:utf-8--

  3. from subprocess import Popen, PIPE
  4. import re

  5. class DiskMonitor(object):
  6.     """Disk Monitoring class"""
  7.     def __init__(self, pattern="5[0-9]%",
  8.                 message="CAPACITY WARNING",
  9.                 cmd = "df -h"):
  10.         self.pattern = pattern
  11.         self.message = message
  12.         self.cmd = cmd

  13.     def disk_space(self):
  14.         """Disk space capacity flag method"""
  15.         ps = Popen(self.cmd, shell=True, stdout=PIPE, stderr=PIPE)
  16.         output_lines = ps.stdout.readlines()
  17.         for line in output_lines:
  18.             line = line.strip()
  19.             if re.search(self.pattern, line):
  20.                 print "%s %s" % (self.message, line)


  21. class MyDiskMonitor(DiskMonitor):
  22.     """Customized Disk Monitoring class"""

  23.     def disk_space(self):
  24.         ps = Popen(self.cmd, shell=True, stdout=PIPE, stderr=PIPE)
  25.         print "RAW DISK REPORT:"
  26.         print ps.stdout.read()


  27. if __name__ == "__main__":
  28.     d = MyDiskMonitor()
  29.     d.disk_space()
  30.     d = MyDiskMonitor(85)
  31.     d.disk_space()

如果运行这个使用继承的脚本版本,您将获得以下输出:

  1. RAW DISK REPORT:
  2. Filesystem Size Used Avail Use% Mounted on
  3. /dev/loop0 14G 11G 2.3G 83% /
  4. udev 744M 4.0K 744M 1% /dev
  5. tmpfs 300M 796K 300M 1% /run
  6. none 5.0M 0 5.0M 0% /run/lock
  7. none 750M 3.0M 747M 1% /run/shm
  8. /dev/sda5 20G 17G 3.0G 85% /host
  9. /dev/sda6 20G 12G 8.4G 58% /media/986058AD605893BA

  10. RAW DISK REPORT:
  11. Filesystem Size Used Avail Use% Mounted on
  12. /dev/loop0 14G 11G 2.3G 83% /
  13. udev 744M 4.0K 744M 1% /dev
  14. tmpfs 300M 796K 300M 1% /run
  15. none 5.0M 0 5.0M 0% /run/lock
  16. none 750M 3.0M 747M 1% /run/shm
  17. /dev/sda5 20G 17G 3.0G 85% /host
  18. /dev/sda6 20G 12G 8.4G 58% /media/986058AD605893BA

此输出与前面带标记的版本区别非常大,因为它只是使用顶部注入的 print 语句来打印的未经筛选的 df –h 命令结果。通过重写 MyDiskMonitor 类中的方法,您能够完全改变 disk_space 方法的意图。

允许您重用其他类中的属性的 Python 魔法是这个“MyDiskMonitor(DiskMonitor)”语句。您只需在定义新类的名称时,将先前的类的名称放在括号内。一旦完成此步骤,您立即可以访问其他类属性来做自己希望的事情。但是乐趣不仅于此。通过添加另一个通过电子邮件来发送标记消息的方法,也许是将其命名为 disk_alert(self),这样就可以进一步自定义新类。这是面向对象的设计的美妙之处;它允许有经验的开发人员不断重用已编写的代码,从而节省大量的时间。

遗憾的是,面向对象的编程也有其不利的一面。所有这些抽象都是以复杂性为代价的,如果抽象过度,可能会彻底地弄巧成拙。由于 Python 支持多重继承,抽象可以达到相当有害的复杂程度。您是否能够想象只是为了编写一个方法也要查看多个文件的情况?无论相信与否,这种情况的确会发生,并且代表了面向对象编程的不幸现实。

面向对象的编程的替代方案是函数式编程,并且 Python 提供了用于进行函数式以及面向对象和过程式编程的资源。在最后一个示例中,我们将研究如何以函数式的方式编写现已变得非常无聊的磁盘监视代码。

  1. from subprocess import Popen, PIPE
  2. import re

  3. def disk_space(pattern="2[0-9]%", message="CAPACITY WARNING:"):
  4.     #Generator Pipeline To Search For Critical Items
  5.     ps = Popen("df -h", shell=True, stdout=PIPE, stderr=PIPE)
  6.     outline = (line.split() for line in ps.stdout)
  7.     flag = (" ".join(row) for row in outline if re.search(pattern, row[-2]))
  8.     for line in flag:
  9.         print "%s %s" % (message, line)


  10. disk_space("58")
  11. disk_space("85")

查看这最后一个示例,它与您从本文中看到的所有其他代码的区别都非常大。如果您逐行浏览该代码,可以首先从 “ps”变量中以前未见过的内容开始。接下来的两行代码使用生成器表达式来处理文件对象 ps.stdout,分析该文件并在其中搜索您正在查找的行。如果您将这些代码行剪切并粘贴到交互式的 Python Shell 中,如果打印的话,您将看到概要和标志都是生成器对象。生成器对象附带有下一个方法,因而允许您通过“管道”将操作连在一起。

概要行从一行中去除新行字符,并往下将该行传递给下一个生成器表达式,后者一次一个地在每行中搜索某个正则表达式匹配项,然后将输出传递给标记。此类紧凑的工作流可以替代面向对象的编程样式,并且相当有趣。然而,这种样式也有缺点,因为代码的简洁性会导致难于调试的错误,除非独立地执行每一行代码。函数式编程还很伤脑筋,因为它让您通过将解决方案链接在一起来考虑解决问题。无论是从过程式还是从面向对象样式的角度看,这都是相当不同的。

本文有点试验性质,因为它从 Bash 和 PHP 谈到了过程、面向对象,并在最后谈到了使用相同基本代码的函数式 Python。但愿本文说明了 Python 是一种非常灵活和功能强大的语言,其他编程语言的开发人员也可以学习欣赏。随着 Python 的越来越流行,其他开发人员除了首选语言之外,学习 Python 也将变得更加重要。

Python 最近的两个最大的发展领域是 Web 开发和系统管理。就 Web 开发而言,PHP 开发人员可能很快就必须做出每周的选择,即哪个项目采用 Python 更有意义,以及哪个项目采用 PHP 更有意义。对于系统管理员、Bash 和 Perl 脚本程序员,他们经常被要求采用 Python 完成某些项目。部分是因为这是没有选择的,部分是因为许多供应商正在为他们的产品提供 Python API。在您的工具箱中准备一点 Python 决不会伤害任何人。




阅读(2400) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~