acwing查看做题总数-专注的阿熊-ChinaUnix博客

专注的阿熊的ChinaUnix博客

首页　| 　博文目录　| 　关于我

专注的阿熊

博客访问： 3695706
博文数量： 365
博客积分： 0
博客等级：民兵
技术积分： 2522
用户组：普通用户
注册时间： 2019-10-28 13:40

文章分类

全部博文（365）

未分配的博文（365）

文章存档

2023年（8）

2022年（130）

2021年（155）

2020年（50）

2019年（22）

我的朋友

相关博文

acwing查看做题总数

分类： Python/Ruby

2021-09-16 17:00:53

import re

import requests

from lxml import etree

class Spider(object):

def __init__(self):

self.base_url = '{}/'

self.headers = {

'Cookie': 'csrftoken=mixU7wxaV35yyyCDhqbXcIoW3z3Ms0NH31jbbqH; sessionid='

'344bo4nowvp9misa9suynjiwz2i5jcof; file_2922585_readed=""; file_2302034_readed=""',

'Referer': '',

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'

' (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'

}

self.count = 0

def get_html(self, url):

html = requests.get(

url=url,

headers=self.headers

).text

return html

def xpath_func(self, html):

name_bds = '//tbody/tr[./td/span[@title="已通过这道题目"]]/td/a/text()'

base_obj = etree.HTML(html)

name_lists = base_obj.xpath(name_bds)

L = []

for i in name_lists:

L.append(i.strip())

return L

def re_func(self, html, re_bds):

pattern = re.compile(re_bds, re.S)

re_list = pattern.findall(html)

return re_list

def parse_html(self, url):

html = self.get_html(url)

L = self.xpath_func(html)

return L

def run(self):

warning = input('您马上就要爬取acwing了，看一下你的做题数，您的劳动成果将会在下面展示出来，外汇跟单gendan5.com确定要看吗？(Y/N)')

if warning == 'Y':

print('爬虫系统已经启动...正在努力抓取，请稍等....')

print('+---------------------------------+')

print('| name |')

print('+---------------------------------+')

for i in range(1, 80):

url = self.base_url.format(i)

L = self.parse_html(url)

for _ in L:

self.count += 1

print('| ' + _)

print('+---------------------------------+')

print('经过您的不懈努力，您一共做了' + str(self.count) + '道题，继续努力！！')

else:

print('已经退出，你这个弱者')

if __name__ == '__main__':

spider = Spider()

spider.run()

阅读(11135) | 评论(0) | 转发(0) |

上一篇：Python—简单图书管理系统

下一篇：用Python画小人发射爱心，还有弹窗设计哦！

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6