Chinaunix首页 | 论坛 | 博客
  • 博客访问: 218474
  • 博文数量: 68
  • 博客积分: 2510
  • 博客等级: 少校
  • 技术积分: 695
  • 用 户 组: 普通用户
  • 注册时间: 2006-05-19 21:17
文章分类

全部博文(68)

文章存档

2009年(16)

2008年(12)

2007年(27)

2006年(13)

我的朋友

分类:

2006-11-29 11:42:52

修改ubuntu字符集,导致网页抓取乱码
 
昨天修改了ubuntu的字符集为zh_utf8,不想今天的部分网页抓取就出错了。原来抓取来的网页都是gb2312,在执行网页抓取及处理的shell代码中出错了。故就在SHELL脚本中增加一句:
 

iconv -f gb2312 -t utf8

问题解决。

阅读(950) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~