当前位置: 首页 > news >正文

比较好的建站程序山西太原网络推广

比较好的建站程序,山西太原网络推广,网站页面头部设计说明,泰州网站建设案例import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下&#xff…
import requestsurl = 'https://movie.douban.com/top250'
response = requests.get(url)
# 查看结果
print(response)

在这里插入图片描述

  在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下,不是说不可用就放弃了。爬虫时经常会遇到有些网站有反爬机制,为了能够请求成功该如何操作?那当然是把我们伪装成浏览器了!

  那么如何把自己伪装成浏览器代替我们发送请求呢?pycharm有个字典Headers,我们需要在浏览器中找到键User-Agent对应的值

User-Agent:对应的值包含了浏览器、操作系统的各项信息。如果没有User-Agent,就相当于赤裸裸的去访问对方服务器,只要对方有反爬虫机制,就能发现你是爬虫。

在浏览器中打开想要爬取的网站,右键 --> 检查然后如下图操作:

在这里插入图片描述

  也有的网站刷新后出现的项目很少,甚至点开没有User-Agent对应的值,但是有一个项目里面一定有 : 项目名跟网站地址很相近的项目中。例如在本例中名为www.zhihu.com的项目里一定含有。

  在以贝壳租房为例,打开网页后,右键 --> 检查,在项目名为zufang中一定含有User-Agent对应的值

在这里插入图片描述

获取键user-agent对应的值后,我们把键与值写入字典Headers中

import requests# 1. 浏览器伪装
url = 'https://movie.douban.com/top250'
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
}
# 获取响应结果
response = requests.get(url, headers=headers)
# 查看状态码
print(response.status_code)  # 200
# 获取网页源代码
# print(response.text)
http://www.hkea.cn/news/9843/

相关文章:

  • 做网站图片的大小广州seo工资
  • 重庆公司买深圳社保搜索引擎优化策略
  • 网站空间的存放种类怎样找推广平台
  • 自己建设的网站有管理后台的登录seo和sem
  • 手机网站开发人员工具企业网址怎么注册
  • 建设一个功能简单的网站数据分析师培训机构推荐
  • 清河哪里做网站河南网络推广那家好
  • 外贸独立站建站详细步骤手机搜索引擎排名
  • 信息产业部网站备案系统杭州seo招聘
  • 长沙网站制作公司百度搜索网页
  • 毕设做网站免费网站建设
  • 五合一网站制作视频教程?百度云app
  • 企业官网建站系统友链
  • wordpress 站外调用百度爱采购
  • 销售网站的优秀标准网站优化的方法与技巧
  • 上传网站过程门户网站排行榜
  • 做招聘网站排名足球世界排名国家
  • 互联网网站开发创业计划书广告联盟平台
  • 网站建设费应怎样做会计分录国内搜索引擎排名第一
  • 网站网页切换怎么做的网站app开发公司
  • 许昌网站建设汉狮怎么样营销手段和营销方式
  • 网站按钮psd网站内容优化怎么去优化呢
  • 温州外贸网站建设培训网站制作
  • 接网站制作搜盘网
  • 东海县网站建设seo站长之家
  • 更改了网站关键词后要怎么做营销推广投放
  • 网站建设文档模板东莞网站优化关键词排名
  • 怎么建立一个网站里面可以查询资料google怎么推广
  • 网站积分的作用推广公司有哪些公司
  • 大连网站建设意动科技seo公司官网