Chinaunix首页 | 论坛 | 博客
  • 博客访问: 19632
  • 博文数量: 3
  • 博客积分: 258
  • 博客等级: 二等列兵
  • 技术积分: 40
  • 用 户 组: 普通用户
  • 注册时间: 2007-11-06 17:17
文章分类

全部博文(3)

文章存档

2014年(2)

2011年(1)

最近访客

分类: Python/Ruby

2014-10-28 10:42:08

出于想投资股票的想法,想获取些投资数据,同时练习下python,于是走上了程序猿的道路。

点击(此处)折叠或打开

  1. # encoding:utf-8
  2.     import sys
  3.     import re
  4.     from urllib2 import Request, urlopen, URLError, HTTPError
  5.       
  6.     def get_packet(url):
  7.         packet = urlopen(url)
  8.         content = packet.read()
  9.         return content.decode('gb2312')
  10.     def get_data(packet):
  11.         xiangmu = '~'
  12.         tmp = re.findall(r'(.*)',packet)
  13.         tmp2 = re.findall('(.*)',packet)
  14.         if tmp is not None:
  15.             xiangmu = tmp
  16.         items = []
  17.         for items in xiangmu:
  18.             print items
  19.             ##print items.encode('utf-16')
  20.         if tmp2 is not None :
  21.             shuju = tmp2
  22.         items2 = []
  23.         for items2 in shuju:
  24.             print items2
  25.         print tmp.encode('gb2312')
  26.     if __name__=='__main__':
  27.         url = ''
  28.         packet = get_packet(url)
  29.         if packet =='~':
  30.             sys.exit(0)
  31.         get_data(packet)
首先获取网页源文件get_packet,然后用正则表达式把想要的字符扣出来。

点击(此处)折叠或打开

  1. (r'(.*)'
(.*)就是扣出来的文字,然后打印输出。re.findall是查找全部匹配的结果,然后返回一个列表。

阅读(2556) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~