Chinaunix首页 | 论坛 | 博客
  • 博客访问: 185703
  • 博文数量: 83
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 846
  • 用 户 组: 普通用户
  • 注册时间: 2018-03-27 14:41
个人简介

宁为玉碎,不为瓦全

文章分类
文章存档

2024年(26)

2023年(28)

2022年(17)

2021年(10)

2019年(1)

我的朋友

分类: Python/Ruby

2022-11-07 16:41:24

11 月 6 日,第 31 届中国电视金鹰奖颁奖典礼如约而至。在国内{BANNED}最佳大的演播室集群 " 七彩盒子 ",全国优秀的电视人齐聚一堂,共享属于电视人的荣耀时刻。飞天奖的热度还未散去,金鹰奖乘势而来,这也让观众对金鹰奖颁奖晚会有了更多的期待。

从获奖演员,电视类型总的来看,今年的金鹰奖成功 " 脱水 ",不再一味追求流量和话题,入围的 36 部电视剧都经得起推敲,各大奖项的评选结果也让人信服。网友们看了颁奖典礼后也给出好评,感慨:金鹰奖终于正常了。因为金鹰奖本身是跟飞天奖和白玉兰奖并列的,含金量也是中国电视剧奖项中{BANNED}最佳高的三个奖项之一,但是因为设立了一些奖项大多都是跟流量明星的人气有关而成为一个“笑柄”。而金鹰奖的含金量也因此大大降低。

这几年关于金鹰奖的各种评价我们可以通过大数据来进行了解,数据的获取是使用的python爬虫技术,数据来源我们可以从微博上有关金鹰奖的话题来获取。做过爬虫的小伙伴都知道,像微博这样比较有价值的数据网站,爬取的过程是稍微有些难度的,而且微博现在的疯狂也很严。在获取数据时先进行了网站分析,因为获取的数据量并不是很大,所以面对爬虫机制的时候我们主要做了代理IP措施,并且使用的是高质量的爬虫代理IP。这里简单的示例下使用代理IP获取数据的demo:


 #! -*- encoding:utf-8 -*-


    import requests
    import random


    # 要访问的目标页面
    targetUrl = ""


    # 要访问的目标HTTPS页面
    # targetUrl = ""


    # 代理服务器(产品官网 )
    proxyHost = "t.16yun.cn"
    proxyPort = "31111"


    # 代理验证信息
    proxyUser = "username"
    proxyPass = "password"


    proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
        "host" : proxyHost,
        "port" : proxyPort,
        "user" : proxyUser,
        "pass" : proxyPass,
    }


    # 设置 http和https访问都是用HTTP代理
    proxies = {
        "http"  : proxyMeta,
        "https" : proxyMeta,
    }




    #  设置IP切换头
    tunnel = random.randint(1,10000)
    headers = {"Proxy-Tunnel": str(tunnel)}






    resp = requests.get(targetUrl, proxies=proxies, headers=headers)


    print resp.status_c

从获取的数据分析看,大家对金鹰奖这几年的态度真的一落千丈,都是各种鄙视,各种嘲笑,这估计也是流量为王时代造成的。但是今年的金鹰奖彻底改变了风向标,不再向流量低头,奖项的评选更看重作品质量和演员的演技," 脱水 " 成功的金鹰奖也获得大众的好评,大家都纷纷表示希望下一届请继续按照这个标准执行。

ode
    print resp.text
阅读(374) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~