当前位置: 首页 > news >正文

策划 网站wordpress seo链接

策划 网站,wordpress seo链接,为什么网站很少做全屏,百度平台电话多少目录 selenium的介绍 1、 selenium是什么#xff1f; 2、selenium的工作原理 3、如何使用selenium#xff1f; webdriver浏览器驱动设置 关键步骤 代码 运行结果 注意事项 selenium的介绍 1、 selenium是什么#xff1f; 用于Web应用程序测试的工具。可以驱动浏览… 目录 selenium的介绍 1、 selenium是什么  2、selenium的工作原理 3、如何使用selenium webdriver浏览器驱动设置 关键步骤 代码 运行结果 注意事项 selenium的介绍 1、 selenium是什么  用于Web应用程序测试的工具。可以驱动浏览器执行特定操作自动按照脚本     代码做出点击输入打开验证等操作就像真实用户所做的一样。     支持的浏览器包括IEFirefoxSafariChromeOpera等。 2、selenium的工作原理 浏览器具有webdriver驱动,这个驱动是根据不同的浏览器开发的     不同的浏览器使用不同的webdriver驱动程序且需要对应相应的浏览器版本     webdriver驱动程序可以通过浏览器内核控制浏览执行指定命令 3、如何使用selenium 使用前准备 a、安装selenium库  b、驱动浏览器的内核驱动 a、安装selenium使用pip install selenium -i https://pypi.mirrors.ustc.edu.cn/simple/                 或在pycharm中安装 b、chrome内核驱动地址    360浏览器使用的就是chrome的内核QQ浏览器使用IEIE https://chromedriver.storage.googleapis.com/index.html   首先确定你的浏览器是使用哪个内核     windows系统下载下来的文件解压后放置在python安装地址的Scripts中     Linux和Mac系统同上注意系统存在2个Python版本确定当前运行的python                     版本配置在环境变量中 爬取苏宁易购平台某款产品的优质评论与差评 webdriver浏览器驱动设置 webdriver具备多种不同浏览器的驱动 browser webdriver.Chrome() browser webdriver.Firefox() browser webdriver.Edge() browser webdriver.PhantomJS() browser webdriver.Safari() 其中.chrome.webdriver import WebDriver as Chrome定义了别名Chrome代表WebDriver 关键步骤 初始化浏览器驱动 使用 selenium 的 Options 对象配置 Edge 浏览器例如可以设置无界面模式。初始化 webdriver.Edge启动浏览器。 抓取优质评价 打开优质评价的 URL。使用 find_elements 查找所有评价内容并将其保存到文件 优质评价1.txt。点击“下一页”按钮循环抓取所有页的评论内容。 抓取差评 打开差评的 URL。使用 find_elements 查找所有差评内容并将其保存到文件 差评.txt。点击“下一页”按钮循环抓取所有页的差评内容。 关闭浏览器 完成抓取后调用 driver.quit() 关闭浏览器。 代码 from selenium import webdriver from selenium.webdriver.edge.options import Options from selenium.webdriver.common.by import By import time# 创建 Edge 浏览器选项对象 options Options() # 在这里可以添加各种选项例如 # options.add_argument(--headless) # 无界面模式# 使用修改后的参数传递方式初始化 Edge 浏览器驱动 driver webdriver.Edge(optionsoptions)# 抓取优质评价 driver.get(https://review.suning.com/cluster_cmmdty_review/cluster-38249278-000000012389328846-0000000000-1-good.htm?originalCmmdtyTypegeneralsafpd488778a.10004.loverRight.166)# 打开文件用于保存优质评价内容 yzpj_file open(优质评价1.txt, w, encodingutf-8)def get_py_content(file):# 查找所有包含评价内容的元素pj_elements_content driver.find_elements(By.CLASS_NAME, body-content)# 遍历每个元素将文本内容写入文件for i in range(len(pj_elements_content)):file.write(pj_elements_content[i].text \n)# 获取第一页的评论内容 get_py_content(yzpj_file)# 查找下一页按钮 next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) print(next_elements)# 循环点击下一页获取所有页的评论内容 while next_elements:next_element next_elements[0]time.sleep(1) # 等待页面加载next_element.click() # 点击下一页get_py_content(yzpj_file) # 获取当前页的评论内容next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) # 重新查找下一页按钮# 关闭优质评价文件 yzpj_file.close()# 抓取差评 driver.get(https://review.suning.com/cluster_cmmdty_review/cluster-38249278-000000012389328846-0000000000-1-bad.htm?originalCmmdtyTypegeneralsafpd488778a.10004.loverRight.166)# 打开文件用于保存差评内容 cpj_file open(差评.txt, w, encodingutf-8)def get_cp_content(file):# 查找所有包含差评内容的元素pj_elements_content driver.find_elements(By.CLASS_NAME, body-content)# 遍历每个元素将文本内容写入文件for i in range(len(pj_elements_content)):file.write(pj_elements_content[i].text \n)# 获取第一页的差评内容 get_cp_content(cpj_file)# 查找下一页按钮 next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) print(next_elements)# 循环点击下一页获取所有页的差评内容 while next_elements:next_element next_elements[0]time.sleep(2) # 等待页面加载next_element.click() # 点击下一页get_cp_content(cpj_file) # 获取当前页的差评内容next_elements driver.find_elements(By.XPATH, //*[classnext rv-maidian ]) # 重新查找下一页按钮# 关闭差评文件 cpj_file.close()# 关闭浏览器 driver.quit()运行结果 1优质评价 2差评 注意事项 浏览器驱动 确保已安装正确版本的 Microsoft Edge 驱动程序并将其路径添加到系统环境变量中。 网页动态加载 使用 time.sleep() 等待页面加载避免因页面未完全加载而导致错误。 文件编码 打开文件时指定 encodingutf-8避免写入内容时出现乱码。 XPath 定位 确保 XPath 表达式正确能够定位到“下一页”按钮。如果网页结构发生变化需要调整 XPath。 无界面模式 如果需要无界面运行可以取消注释 options.add_argument(--headless)。
http://www.hkea.cn/news/14261450/

相关文章:

  • 网站建设英语要几级建设银行内部网站源码
  • 怎样一个域名做两个网站h5端是手机端吗
  • 湖南省政务服务网 网站建设要求360网站推广官网球阀
  • 新闻门户网站是什么wordpress seo联接插件
  • 做网站时连服务器上的数据库飞沐网站建设北京
  • 网站外包建设模板搭建
  • 南山做网站的公司电子元器件网站建设
  • mysol做的选课网站网站建设及上线流程
  • 做网站效果电商网站开发多少钱
  • 深圳专门做兼职的网站编程网站项目做哪个比较好
  • 网站开发技术服务费合同范本WordPress百度快照图片
  • 简单网站建设课程网站域解析查询
  • 具有品牌的网站建设好用的免费网站
  • 平阳手机网站制作专业影视广告制作公司
  • 网站建设需要下载哪些软件网站代码调试
  • 怎样建立静态网站网站建设合同 技术合同
  • 网站和域名区别wordpress音乐播放器刷新
  • 网站专题页面设计欣赏做地暖工程的网站
  • 怎样在建立公司网站万网手机网站
  • 小型企业网站建设旅游景点网论文wordpress主机记录
  • 网站关键词排名外包网站云解析域名解析
  • 有一个做搞笑英语视频网站三站合一网站营销
  • 北京做网站男生工资网站建设的描述
  • 网站开发模板免费下载域名多少钱一年
  • 电子商务网站推广计划访问网站需要账号密码
  • 深圳网站建设php推广策略有哪些方法
  • dede新手做网站多久网站建设公司公司我我提供一个平台
  • phpmysql网站开发实例装修公司工装公司
  • 怎么用APdiv做网站导航栏网页平台制作
  • 电子商务安全问题 网站权限WordPress 云 memcache