主页 分类 关于

爬虫 爬猫猫图片(牢饭吃到饱)

每天一个入狱小技巧

综合练习

打开这个网址

# 所有用到的库
import requests
import re
import time

# 要爬的链接
url = "http://www.ichong123.com/maomao"

# 请求头
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.72 Safari/537.36"
}

paqv = requests.get( url=url, headers=headers )

# 根据网站的编码来换
paqv.encoding = 'utf-8'

# xiazai = paqv.text

# print(xiazai)

# 正则表达式 re.S单行匹配(正则解析比较多) re.M多行匹配()
sdq1 = re.compile(r'<div class="pet_s">.*?<img src=(?P<mao>.*?)width',re.S)
paq = sdq1.finditer(paqv.text)
a = 1
# 用循环来依次下载
for it in paq:
time.sleep(3) #休眠3秒
ul = it.group('mao')
ul2 = eval(ul) #eval()函数用来执行一个字符串表达式, 并返回表达式的值
sdz = requests.get(ul2)

# 图片文件保存 选择路径
with open(f"E:/百度文档/mao/{a}.jpg","wb") as f:
f.write(sdz.content)
f.close()
a+=1
print("猫猫下载完了")









作者: 我叫史迪奇
本文来自于: https://sdq3.link/reptile-mao.html博客内容遵循 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议