找回密码
 立即注册
搜索
热搜: Excel discuz
查看: 2149|回复: 1

[项目代码] 本站爬图测试

[复制链接]

492

主题

7万

元宝

77万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
770449
发表于 2021-7-21 21:02:59 | 显示全部楼层 |阅读模式
237caef03abb288ea50f522f.jpg

192534c22e692977b319a8f4.jpg

DSCF0002.jpg

DSCF0007.jpg

DSCF0014.jpg

连杰.jpg

连杰45.jpg

杀破狼1.jpg

马畅.jpg

王谦1.jpg

吴京.jpg

无标题.bmp

甄子丹.jpg

越狱.bmp


回复

使用道具 举报

492

主题

7万

元宝

77万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
770449
 楼主| 发表于 2021-7-21 21:05:37 | 显示全部楼层
  1. import requests
  2. import os
  3. from lxml import etree
  4. if not os.path.exists('c:/cl'):
  5.     os.mkdir('c:/cl')
  6. url = 'http://zhaoqianzhou.com/forum.php?mod=viewthread&tid=325&extra='
  7. UA = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
  8. respon = requests.get( url = url,headers=UA).text
  9. jiexi = etree.HTML(respon)
  10. picurl = jiexi.xpath('//div[@class="t_fsz"]//@file')
  11. for i in picurl:
  12.     newpicurl = 'http://zhaoqianzhou.com/'+i
  13.     picdate = requests.get(url=newpicurl,headers=UA).content
  14.     picname = newpicurl.split('/')[-1]
  15.     pinadd = 'c:/cl/'+ picname
  16.     with open(pinadd,'wb') as tu:
  17.         tu.write(picdate)
  18.         print(picname,'下载完成')
复制代码
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2024-12-22 00:22 , Processed in 0.071170 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表