Chinaunix首页 | 论坛 | 博客
  • 博客访问: 5483461
  • 博文数量: 1633
  • 博客积分: 18684
  • 博客等级: 上将
  • 技术积分: 15197
  • 用 户 组: 普通用户
  • 注册时间: 2010-06-02 10:28
文章分类

全部博文(1633)

文章存档

2021年(8)

2020年(43)

2019年(27)

2018年(44)

2017年(50)

2016年(47)

2015年(15)

2014年(21)

2013年(43)

2012年(143)

2011年(228)

2010年(263)

2009年(384)

2008年(246)

2007年(30)

2006年(38)

2005年(2)

2004年(1)

分类: 系统运维

2014-09-10 16:11:49

代码如下:
#载入RCrul
library(RCurl)

#修改clientheader
myheader=c("User-Agent"="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.125 Safari/537.36",
"Accept"="*/*",
"Accept-Language"="zh-CN,zh;q=0.8",
"Connection"="keep-alive"
)
#调试使用,老师给的那个headher好像不能使用
#"Referer"=""

urllist=0
page=1:7
urllist[page]=paste(")

for(url in urllist){
#获取妹子图
temp=getURL(url,httpheader=myheader)
k = strsplit(temp,"\r\n")[[1]]
#正则
pattern='

'
pattern2='jpg" />'

tempurl=k[grep(pattern,k)]
temp2=tempurl[grep(pattern2,tempurl)]
urladdr=regexec(pattern,temp2)
m <- regexpr('http://(.*).jpg',temp2)
url=regmatches(temp2,m)
#写入文件
write.table(url,file="url.txt",append = TRUE)
Sys.sleep(10)
}

 

阅读(1889) | 评论(0) | 转发(0) |
0

上一篇:Keystone源码安装

下一篇:ROS收藏

给主人留下些什么吧!~~