爬虫爬猫猫图片(牢饭吃到饱)

综合练习

每天一个入狱小技巧

综合练习

打开这个网址

# 所有用到的库
import requests
import re
import time

# 要爬的链接
url = "http://www.ichong123.com/maomao"

# 请求头
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.72 Safari/537.36"
}

paqv = requests.get( url=url, headers=headers )

# 根据网站的编码来换
paqv.encoding = 'utf-8'

# xiazai = paqv.text

# print(xiazai)

# 正则表达式 re.S单行匹配(正则解析比较多) re.M多行匹配()
sdq1 = re.compile(r'<div class="pet_s">.*?<img src=(?P<mao>.*?)width',re.S)
paq = sdq1.finditer(paqv.text)
a = 1
# 用循环来依次下载
for it in paq:
    time.sleep(3)  #休眠3秒
    ul = it.group('mao')
    ul2 = eval(ul)  #eval()函数用来执行一个字符串表达式, 并返回表达式的值
    sdz = requests.get(ul2)

    # 图片文件保存 选择路径
    with open(f"E:/百度文档/mao/{a}.jpg","wb") as f:
        f.write(sdz.content)
        f.close()
        a+=1
print("猫猫下载完了")

作者: 我叫史迪奇
本文来自于: https://sdq3.link/reptile-mao.html博客内容遵循署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议

爬虫 爬猫猫图片(牢饭吃到饱)

综合练习

爬虫爬猫猫图片(牢饭吃到饱)