Chinaunix首页 | 论坛 | 博客
  • 博客访问: 268746
  • 博文数量: 84
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 927
  • 用 户 组: 普通用户
  • 注册时间: 2015-03-06 23:00
个人简介

growing

文章分类

全部博文(84)

文章存档

2017年(6)

2016年(61)

2015年(17)

我的朋友

发布时间:2017-03-06 19:48:58

文件1为key,文件2为key-value(两列),从文件1读取key,然后从文件2中找出value后叠加import re$import urllib2$def itercolumn23(filename, splitregex = '\t'):$     with open(filename, 'rt') as handle:$     &n.........【阅读全文】

阅读(3902) | 评论(0) | 转发(0)

发布时间:2016-11-05 11:24:07

前几天从接口拿下来一些东西,发现输出之后为类似:/u4e00-/u9fa5 这样的编码,本来以为是json解析的问题,后来发现是转码不对,直接转码会提示: js json.loads(res.encode())然后再就可以像数组一样'data'0'id'......【阅读全文】

阅读(1977) | 评论(0) | 转发(0)

发布时间:2016-11-01 14:16:51

场景描述:在日志文件中用python提取出自己需要的字段,在用shell来排序并把前n名输出到文件中。从文日志里抓出想要的序列,排序之前:序列号  所出现次数(未统计,默认为一)排序之后:1.从日志里利用正则提取关键字#!/usr/bin/python# coding:utf-8import re.........【阅读全文】

阅读(1893) | 评论(0) | 转发(0)

发布时间:2016-07-03 10:41:55

总思路如下:1.提取网页的源代码并写入文本文件2.利用正则表达式提取源代码中我们需要的3.下载我们爬到的文件这里我是爬了堆糖网陈冠希的图片,网站戳:这里看一下原网页的源代码中我们需要的:注意看划红线的里面的网站就是我们想要爬到的图片下面开始写代码爬取# coding:utf-8.........【阅读全文】

阅读(1526) | 评论(0) | 转发(0)
给主人留下些什么吧!~~

enenshiwo2016-04-12 10:56

回复  |  举报
留言热议
请登录后留言。

登录 注册