当前位置: 首页 > news >正文

男女性男女直接做的视频网站二级建造师执业资格考试

男女性男女直接做的视频网站,二级建造师执业资格考试,网站的版面布局,高清免费素材网写在前面 建立Python爬虫IP代理池可以提高爬虫的稳定性和效率#xff0c;可以有效避免IP被封锁或限制访问等问题。 下面是建立Python爬虫IP代理池的详细步骤和代码实现#xff1a; 1. 获取代理IP 我们可以从一些代理IP网站上获取免费或付费的代理IP#xff0c;或者自己租…写在前面 建立Python爬虫IP代理池可以提高爬虫的稳定性和效率可以有效避免IP被封锁或限制访问等问题。 下面是建立Python爬虫IP代理池的详细步骤和代码实现 1. 获取代理IP 我们可以从一些代理IP网站上获取免费或付费的代理IP或者自己租用代理IP服务。这里我们以站大爷代理为例获取前10页的HTTP代理IP地址。 import requests from scrapy.selector import Selectordef get_proxy_ips():proxy_ips []for i in range(1, 11):url https://www.zdaye.com/free/.format(i)headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3}res requests.get(url, headersheaders)selector Selector(textres.text)trs selector.css(#ip_list tr)for tr in trs[1:]:ip tr.css(td:nth-child(2)::text).extract_first()port tr.css(td:nth-child(3)::text).extract_first()proxy_ips.append({}:{}.format(ip, port))return proxy_ips2. 检测代理IP的可用性 获取到代理IP后需要对其进行可用性的检测筛选出可用性较高的IP地址。这里我们测试以百度为目标网站检测HTTP代理IP地址的可用性如果响应码为200则表明该IP地址可用。 import requestsdef check_proxy_ip(ip):url http://www.baidu.comheaders {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3}proxies {http: http:// ip, https: https:// ip}try:res requests.get(url, headersheaders, proxiesproxies, timeout10)if res.status_code 200:return Trueelse:return Falseexcept:return False 3. 将可用的代理IP存储到池中 将可用的代理IP存储到一个IP池中根据需要可以设置IP池的容量和存储时间。这里我们将可用的IP地址存储到redis数据库中。 import redisdef save_proxy_ips():proxy_ips get_proxy_ips()pool redis.ConnectionPool(hostlocalhost, port6379, db0)r redis.Redis(connection_poolpool)for ip in proxy_ips:if check_proxy_ip(ip):r.sadd(proxy_ip_pool, ip) 4. 在爬虫程序中使用代理IP池 在爬虫程序中设置代理IP池并在请求时随机选择一个可用的代理IP地址进行访问。这里我们使用requests库和random模块实现。 import requests import redis import randomdef get_my_ip():url http://httpbin.org/ipres requests.get(url)return res.json()[origin]def get_random_proxy():pool redis.ConnectionPool(hostlocalhost, port6379, db0)r redis.Redis(connection_poolpool)ip r.srandmember(proxy_ip_pool)return ip.decode(utf-8)# 随机选择代理IP进行访问 def crawl(url):proxy {http: http://get_random_proxy(), https: https://get_random_proxy()}headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3}try:res requests.get(url, headersheaders, proxiesproxy, timeout10)if res.status_code 200:return res.textelse:return Noneexcept:return None 总结 需要注意的是代理IP池的建立和使用需要注意IP的有效性和时效性及时更新池中的IP地址以保证代理IP的可用性。同时在使用代理IP时需要遵守相关法律法规和网站的使用协议不得用于非法活动。
http://www.hkea.cn/news/14528946/

相关文章:

  • 电商网站规划论文浙江台州做网站的公司
  • 返利网站开发一般要多少钱孝感市建设网站
  • 实验一 电子商务网站建设与维护做网站seo的步骤
  • 国外网站为啥速度慢dw网站模板免费下载
  • 用python做美食网站青海省建设厅网站公示公告
  • 金华网站建设工程网站建设个人网站制作流程
  • 网站建设公司哪家好服装网站建设比较好
  • 简述网站制作流程wdcp网站无法访问
  • 网站关键词怎么优化排名主做熟人推荐的招聘网站
  • 网站建设合同有法律效益吗山西建设机械网站首页
  • 长春专业企业网站建设价格网站建设网站备案所需资料
  • 天津做宠物饲料的网站呼和浩特公司做网站
  • 绍兴企业网站开发注册360建筑网平台
  • 微信订单网站模版网站设计方案图
  • iis网站重定向网站制作方案大全
  • python做后台开发移动网站主题网站设计实验步骤
  • 有些网站勤换域名怎么搭建源码网站
  • 优质网站建设廉政网站建设的意义
  • 网站建设的基本流程是怎样的手机上如何制作自己的网站
  • 怎么做支付网站数据中台系统
  • 社交博客网站开发国外网站的分析工具有哪些
  • 做网站怎么选择上市公司成都美誉网站设计
  • 硅胶 技术支持 东莞网站建设虚拟网站怎么做
  • windows server iis 添加网站泰州市做网站
  • 手机网站开发用什么服装设计公司排行榜
  • 网站怎么升级网络推广团队分工
  • 如何推广外贸型网站linux做网站要多大内存
  • 孝感房产网站建设亿网联播
  • 做一个在线支付网站做杂志的网站
  • 站长友情链接平台yzipi主题wordpress