Chinaunix首页 | 论坛 | 博客
  • 博客访问: 5771560
  • 博文数量: 675
  • 博客积分: 20301
  • 博客等级: 上将
  • 技术积分: 7671
  • 用 户 组: 普通用户
  • 注册时间: 2005-12-31 16:15
文章分类

全部博文(675)

文章存档

2012年(1)

2011年(20)

2010年(14)

2009年(63)

2008年(118)

2007年(141)

2006年(318)

分类: Python/Ruby

2008-06-13 12:56:30

在linux和windows下面,处理输入有些问题,改天再解决 :-)

#!/usr/bin/env python
#  -*- fileencoding:gbk -*-

import urllib2
import re
import sys


name = "菊花台"
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]

URL1 = ""
URL2 = "&b=+%CB%D1%CB%F7+&lg=0&k=&aid=&ty=1"

URL = URL1 + urllib2.quote(name) + URL2
#URL = "%C7%E0%BB%A8%B4%C9&b=+%CB%D1%CB%F7+&lg=0&k=&aid=&ty=1"

sock = opener.open(URL)
htmlsource = sock.read()

lrcpattern = re.compile(r'ty=9.+?w=(.+?) target=_blank>')
list = re.findall(lrcpattern,htmlsource)

list = dict.fromkeys(list).keys()
for i in list:
    print i
    lrcURL = "" + i
    print lrcURL

sock.close()

阅读(3313) | 评论(2) | 转发(0) |
给主人留下些什么吧!~~

rockins2008-07-08 11:24:15

urllib2和re是个好东西呐

rockins2008-07-08 11:24:15

urllib2和re是个好东西呐