Chinaunix首页 | 论坛 | 博客
  • 博客访问: 973839
  • 博文数量: 403
  • 博客积分: 27
  • 博客等级: 民兵
  • 技术积分: 165
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-25 22:20
文章分类

全部博文(403)

文章存档

2016年(3)

2015年(16)

2014年(163)

2013年(222)

发布时间:2014-05-27 10:55:32

    BeautifulSoup是Python的一个第三方库,可用于帮助解析html/XML等内容,以抓取特定的网页信息。目前最新的是v4版本,这里主要总结一下我使用的v3版本解析html的一些常用方法。1.初始化   导入模块#!/usr/bin/env pythonfrom BeautifulSoup import BeautifulSoup  .........【阅读全文】

阅读(716) | 评论(0) | 转发(0)

发布时间:2014-05-27 10:53:04

好久没写技术相关的博文,这次写篇有意思的,关于一个有意思的游戏——QQ找茬,关于一种有意思的语音——Python,关于一个有意思的库——Qt。这是一个用于QQ大家来找茬(美女找茬)的辅助外挂,开发的原因是看到老爸天天在玩这个游戏,分数是惨不忍睹的负4000多。他玩游戏有他的乐趣,并不很在意输赢,我做这个也只是.........【阅读全文】

阅读(909) | 评论(1) | 转发(0)

发布时间:2014-05-23 09:37:47

操作系统:ubuntu10.04前言:    在通信过程中,无法知道将会接收到的数据的长度,因此开一个固定大小的缓冲区并不合适,开大了,很可能大多数通信都只是几十个自己而已;开小了,又无法处理大数据。因此最好的方法就是创建内存池,根据实际情况,分配合适大小的内存空间。一,思路二,实现三.........【阅读全文】

阅读(693) | 评论(0) | 转发(0)

发布时间:2014-05-23 08:50:10

如果能够模拟一个没有界面的浏览器,还有什么不能做到的呢?关于解析Ajax网站的框架也有不少,
我选择了HtmlUnit,官方网站:http://htmlunit.sourceforge.net/?,htmlunit可以说是一个Java
版本的无界面浏览器,几乎无所不能,而且很多东西都封装得特别完美。
......【阅读全文】

阅读(1514) | 评论(0) | 转发(0)

发布时间:2014-05-23 08:49:27

在python中获取当前位置所在的行号和函数名   对于python,这几天一直有两个问题在困扰我:1.python中没办法直接取得当前的行号和函数名。这是有人在论坛里提出的问题,底下一群人只是在猜测python为什么不像__file__一样提供__line__和__func__,但是却最终也没有找到解决方案。 2.如果一个.........【阅读全文】

阅读(664) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册