当前位置: 首页 > news >正文

网站建设的建议网站优化推广方法

网站建设的建议,网站优化推广方法,深圳专业做网站技术,稿定设计app软件下载用Python Playwright调试时,发现不用无头浏览器(即headlessFalse)代码能够运行成功,但是一用无头浏览器时(即headlessTrue)就会报错,提示找不到元素。换成Firefox浏览器又不会有这个问题&#…

用Python + Playwright调试时,发现不用无头浏览器(即headless=False)代码能够运行成功,但是一用无头浏览器时(即headless=True)就会报错,提示找不到元素。换成Firefox浏览器又不会有这个问题,有可能是因为网站有一个前段反爬虫手段。(同理,如果大家使用playwright codegen时遇到机器人检测的网站过不去的,也可以尝试加上-b firefox参数去指定使用Firefox浏览器去录制脚本,亲测对一些机器人检测的网站友好很多)

其中一种常见的反爬虫手段是通过检测当前user-agent是否为真实浏览器来区分当前请求是否来自真实用户。爬虫使用的常见user-agent类型为:

user-agent为空。没有设置user-agent。
user-agent中包含特殊字符。如:python,java,bot,spider,headless等。

而使用Playwright的Chrome无头浏览器访问网站时,user-agent中会自动添加Headless字段。当网站检测到user-agent包含Headless时判定为非真实请求时,可能会返回空页面,所以导致无头浏览器找不到元素。

因此我们需要添加user-agent来进行浏览器伪装,用浏览器到

https://www.useragentstring.com/index.php

这个网站可以查看当前浏览器使用的User Agent String,例如我的浏览器的User Agent String是Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36

随后参考以下示例,添加浏览器启动参数即可

def run(playwright: Playwright) -> None:browser = playwright.chromium.launch(headless=True, args=['--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'])
http://www.hkea.cn/news/548/

相关文章:

  • 怎么做html5网站吗sem优化服务公司
  • 淘宝客网站开发平台网络外包运营公司
  • SEO网站公司小程序开发教程全集免费
  • 贵州网站建设联系电话百度一下百度一下你知道
  • 网站建设与维护考试卷山东百度推广代理
  • 32岁学做网站网络推广软文怎么写
  • 广州天河网站制作如何通过网络营销自己
  • wordpress商品分销广州网站优化服务
  • 宁波网页制作重庆seo推广
  • 小学学校网站建设方案东莞网络营销网络推广系统
  • 网站推广策划思维导图淄博seo网站推广
  • app软件定制开发一般多少钱郑州网站seo外包公司
  • wordpress设置2个网站如何做网销
  • 赤峰微信网站建设如何建立一个自己的网站?
  • 怎么推广自己的链接济南网站优化
  • 初学者怎么做php网站seo公司后付费
  • 高德地图可以看国外吗seo关键词挖掘
  • 网站发的文章怎么做的营销网站系统
  • 福州网站制作培训山西优化公司
  • 一个空间怎么放两个网站sem是什么专业
  • 专门做甜点的视频网站长沙网站公司品牌
  • 网站推广行业赚钱吗比较靠谱的推广平台
  • 网站的优化靠谱seo关键词的作用
  • 银川市住房和城乡建设局网站公告深圳网络推广渠道
  • shopify可以做企业网站嘛视频专用客户端app
  • 如何构建大型网站架构百度竞价关键词出价技巧
  • 网站建设英文版优化大师是干什么的
  • 旅游网站建设外现状如何做网络营销
  • 诚聘网站开发人员搜索引擎优化网站的网址
  • 做视频解析网站犯法百度推广账户搭建