Python的听课笔记案例8--空气污染指数计算5.0

原创
小哥 3年前 (2022-10-29) 阅读数 9 #大杂烩

此前,获取数据都是使用事先准备的文件,时间敏感性很强。
为了更有效、更快速地获取和利用网络信息,更高效地工作,网络爬虫应运而生。
使用网络爬虫实时获取城市空气质量指数。

什么是网络爬虫?
自动捕获互联网信息的程序;使用互联网数据进行分析和产品开发。

步骤:
1,通过Web链接获取Web内容
2对获取的网页内容进行处理

requests模块
requests该模块是一个简单、简单的过程。HTTP所需工具
支持非常丰富的链接访问功能,包括URL获取,HTTP会话,Cookie记录等。

requests网页请求

函数

含义

get()

对应HTTP的GET方式

post()

对应HTTP的POST传递用户数据的方式

requests对象属性

函数

含义

status_code

HTTP请求的回放状态,200表示链接成功,400表示失败。

text

HTT相应内容的字符串形式,即E。url对应的页面内容

直接代码:

"""
    作者:lanxingbudui
    日期:2020-02-24
    功能:AQI计算
    版本:5.0
"""

import requests

def get_html_text(url):
    """
        返回url的文本
    """
    r = requests.get(url, timeout=30)
    print(r.status_code)
    return r.text

def main():
    """
        主函数
    """
    city_pinyin = input(请输入城市拼音:)
    url = http://pm25.in/ + city_pinyin
    url_text = get_html_text(url)

    aqi_div = 
index = url_text.find(aqi_div) begin_index = index + len(aqi_div) end_index = begin_index + 2 aqi = url_text[begin_index: end_index] print(空气质素为:{}.format(aqi)) if __name__ == __main__: main()

pycharm中没有requests模块,在import requests模块报告错误。解决方案如下:
1、打开pycharm软件,请点击file-->点击setting
2,在目录下单击Project Interpreter在目录的右侧,单击右上角+
3,在输入框中输入requests,单击安装(提示符sucessful表名安装成功时)
ps:在pycharm在中安装其他第三方库也是相同的步骤。

版权声明

所有资源都来源于爬虫采集,如有侵权请联系我们,我们将立即删除