Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1788963
  • 博文数量: 335
  • 博客积分: 4690
  • 博客等级: 上校
  • 技术积分: 4341
  • 用 户 组: 普通用户
  • 注册时间: 2010-05-08 21:38
个人简介

无聊之人--除了技术,还是技术,你懂得

文章分类

全部博文(335)

文章存档

2016年(29)

2015年(18)

2014年(7)

2013年(86)

2012年(90)

2011年(105)

分类: Python/Ruby

2011-09-08 21:55:13

8.10. Summary

Python provides you with a powerful tool, sgmllib.py, to manipulate HTML by turning its structure into an object model. You can use this tool in many different ways.

Python给你提供一个非常强大的工具:sgmllib.py,来操作html通过将它的结果转换成一个对象模型。你可以 以不同的方式使用该方法。

  • parsing the HTML looking for something specific
  • 通过解析html来查找某些特定的对象
  • aggregating the results, like the URL lister
  • 对结果进行聚集,如UrLlister
  • altering the structure along the way, like the attribute quoter
  • 按你的方式改变结果,如 attribute quoter
  • transforming the HTML into something else by manipulating the text while leaving the tags alone, like the Dialectizer
  • 通过对文本进行操作来将html转换成其它的内容,而仅留下标签,如Dialectizer

Along with these examples, you should be comfortable doing all of the following things:

按照例子,你应该熟练掌握下面的所有内容:

  • Using locals() and globals() to access namespaces
  • 使用locals(),global()s来访问命名空间
  • Formatting strings using dictionary-based substitutions
  • 掌握使用了基于字典的字符串替换的格式化字符串

 

阅读(1296) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~