当前位置: 首页 > news >正文

做网站需要备案几次潍坊百度seo

做网站需要备案几次,潍坊百度seo,保健品网站模板,在线设计公司logo写在前面 工作中遇到#xff0c;简单整理理解不足小伙伴帮忙指正 对每个人而言#xff0c;真正的职责只有一个#xff1a;找到自我。然后在心中坚守其一生#xff0c;全心全意#xff0c;永不停息。所有其它的路都是不完整的#xff0c;是人的逃避方式#xff0c;是对大…写在前面 工作中遇到简单整理理解不足小伙伴帮忙指正 对每个人而言真正的职责只有一个找到自我。然后在心中坚守其一生全心全意永不停息。所有其它的路都是不完整的是人的逃避方式是对大众理想的懦弱回归是随波逐流是对内心的恐惧 ——赫尔曼·黑塞《德米安》 采集流程 自动登陆获取商家排名页当前页数据获取总页数和下一页对应元素根据总页数 循环遍历模拟点击下一页获取数据分页数据数据汇总 from seleniumwire import webdriver import json import time from selenium.webdriver.common.by import By import pandas as pd# 自动登陆 driver webdriver.Chrome() with open(C:\\Users\山河已无恙\\Documents\GitHub\\reptile_demo\\demo\\cookie.txt, r, encodingu8) as f:cookies json.load(f)driver.get(https://cdn.chinaz.com/) for cookie in cookies:driver.add_cookie(cookie)driver.get(https://cdn.chinaz.com/)time.sleep(6) #CND 商家排行获取 https://cdn.chinaz.com/ CDN_Manufacturer [] new_div_element driver.find_element(By.CSS_SELECTOR, .toplist-main) div_elements new_div_element.find_elements(By.CSS_SELECTOR, .ullist) #CDN_Manufacturer.extend(div_elements) for mdn_ms in div_elements:a_target mdn_ms.find_element(By.CSS_SELECTOR,.tohome)home_url a_target.get_attribute(href)print(mdn_ms.text)text_temp str(mdn_ms.text).split(\n)CDN_Manufacturer.append({公司名称: text_temp[0],官网地址: home_url,经营资质: text_temp[1],CDN网站数量: text_temp[2],网站占比: text_temp[3],IP节点:text_temp[4],IP占比:text_temp[5],}) sum_page driver.find_element(By.XPATH,//a[contains(title, 尾页)]) attribute_value sum_page.get_attribute(val)print(attribute_value) for page in range(1,int(attribute_value)):next_page driver.find_element(By.XPATH,//a[contains(title, 下一页)])next_page.click()time.sleep(5)new_div_element driver.find_element(By.CSS_SELECTOR, .toplist-main)div_elements new_div_element.find_elements(By.CSS_SELECTOR, .ullist)#CDN_Manufacturer.extend(div_elements)for mdn_ms in div_elements:a_target mdn_ms.find_element(By.CSS_SELECTOR,.tohome)home_url a_target.get_attribute(href)print(mdn_ms.text)text_temp str(mdn_ms.text).split(\n)CDN_Manufacturer.append({公司名称: text_temp[0],官网地址: home_url,经营资质: text_temp[1],CDN网站数量: text_temp[2],网站占比: text_temp[3],IP节点:text_temp[4],IP占比:text_temp[5],})#print(CDN_Manufacturer) #a_list page_element.find_elements(By.TAG_NAME,a) for mdn_ms in CDN_Manufacturer:#divs mdn_ms.find_elements(By.XPATH,//div)passdf pd.DataFrame(CDN_Manufacturer)# 将数据保存为CSV文件 df.to_csv(CDN_Manufacturer.csv, indexFalse)print(数据已保存为CSV文件) pd 直接打印 生成结果 数据已保存为CSV文件公司名称 官网地址 ... IP节点 IP占比 0 百度云加速 https://cloud.baidu.com/product/cdn.html ... 92100 4.7% 1 阿里云 https://www.aliyun.com/ ... 238994 12.3% 2 腾讯云 https://cloud.tencent.com/ ... 57212 2.9% 3 知道创宇云防御 https://www.yunaq.com/jsl/ ... 16333 0.8% 4 网宿 http://www.chinanetcenter.com/ ... 67683 3.5% .. ... ... ... ... ... 67 睿江CDN http://www.efly.cc/ ... 1 0.1 68 领智云画科 http://www.linkingcloud.com/ ... 6 0.1 69 郑州珑凌 http://www.lonlife.cn/ ... 1 0.1 70 中国联合网络 http://www.wocloud.cn/ ... 2 0.1 71 极兔云CDN https://www.jitucdn.com/ ... 9 0.1数据可视化 通过 pyecharts 对数据做简单可视化 def to_echarts(CDN_Manufacturer):from pyecharts.charts import Barfrom pyecharts import options as opts# 内置主题类型可查看 pyecharts.globals.ThemeTypefrom pyecharts.globals import ThemeTypexaxis [ cdn[公司名称] for cdn in CDN_Manufacturer ][:10]yaxis1 [ cdn[CDN网站数量] for cdn in CDN_Manufacturer ][:10]yaxis2 [ cdn[IP节点] for cdn in CDN_Manufacturer ][:10]bar (Bar(init_optsopts.InitOpts(themeThemeType.LIGHT)).add_xaxis(xaxis).add_yaxis(CDN网站数量, yaxis1).add_yaxis(IP节点, yaxis2).set_global_opts(title_optsopts.TitleOpts(title主标题, subtitle副标题)) ) bar.render()也可以考虑其他一些可视化工具 MatplotlibMatplotlib 是 Python 中最常用的数据可视化库之一提供了广泛的绘图功能包括折线图、散点图、柱状图、饼图等。它可以用于创建静态图表和交互式图形并且可以高度定制。 SeabornSeaborn 是基于 Matplotlib 的统计数据可视化库专注于统计图表和信息可视化。Seaborn 提供了更高级的统计图表类型并具有更好的默认样式和颜色主题。 PlotlyPlotly 是一个交互式可视化库可创建高度定制化的图表和可视化界面。Plotly 提供了丰富的图表类型包括折线图、散点图、柱状图、热力图等并支持创建交互式的仪表盘和可视化应用。 BokehBokeh 是一个用于创建交互式图表和可视化的库具有强大的绘图能力和跨平台的支持。Bokeh 可以生成 HTML、JavaScript 和 WebGL从而实现跨浏览器和跨设备的可视化。 AltairAltair 是一个声明式的数据可视化库使用简单的 Python 语法生成可视化图表。Altair 基于 Vega-Lite 规范具有清晰的语法和简洁的API。 博文部分内容参考 © 文中涉及参考链接内容版权归原作者所有如有侵权请告 pyecharts: https://pyecharts.org/#/zh-cn/quickstart Matplotlib: https://github.com/matplotlib/matplotlib Seaborn: https://github.com/seaborn/seaborn Plotly: https://github.com/plotly/plotly.py Bokeh: https://github.com/bokeh/bokeh Altair: https://github.com/altair-viz/altair © 2018-2023 liruilongergmail.com, All rights reserved. 保持署名-非商用-相同方式共享(CC BY-NC-SA 4.0)
http://www.hkea.cn/news/14456694/

相关文章:

  • 网站彩票做号大庆市住房和城乡建设局网站
  • 做网站手机模板app营销活动策划网站
  • 刹车片图纸网站建设望野古诗原文翻译
  • ppt模板下载的网站抖音小程序推广计划怎么开通
  • 建 新闻 网站秦皇岛市人口
  • 资源网站优化排名dede门户网站模板下载
  • 各大网站vip接口建设西安医院网站建设
  • 网站网页建设与维护蚌埠网页设计培训
  • 官方购物网站正品什么叫网站建设方案书
  • 网页制作和网站制作有什么区别开发手机app价格
  • 莱芜网站优化平台高端网站网站设计
  • 网站建设个人博客中山做网站的公司
  • 阜宁做网站公司开发门户网站报价
  • 怎样添加网站上百度商桥代码手机网站策划书
  • 同江佳木斯网站设计大型网站 php
  • 做网站商城需要多少钱华为云服务器购买
  • 建设银行网站用户名阿里邮箱企业版登录入口
  • 做网站服务器有哪些石油化工工程建设人才招聘网站
  • 章丘哪里有建设网站的怎么做网站 有空间
  • 互联网网站 数据库手机快速建站
  • 公司网站seo公司怎么建设游戏试玩平台网站
  • linux如何架设网站织梦商城网站
  • 自己做盈利视频网站麻将网站开发
  • 做公司网站怎么删除图片抚州的电子商务网站建设公司
  • 网站建设中 模板wordpress禁用谷歌字体
  • 佛山网站设计外包番禺网站推广公司
  • .net 网站域账号自动验证码亚马逊查关键词排名工具
  • 温州购物网络商城网站设计制作建筑工程网络计划图绘制软件
  • 平面设计公司网站外贸公司系统管理软件
  • 蚌埠企业做网站房地产开发商是干什么的