当前位置: 首页 > news >正文

广东省建设教育协会网站个人旅游网站建设方案

广东省建设教育协会网站,个人旅游网站建设方案,腾讯企业邮箱账号,福州作公司网站的公司分享112个HTML娱乐休闲模板#xff0c;总有一款适合您 112个HTML娱乐休闲模板下载链接#xff1a;https://pan.baidu.com/s/15uBy1SVSckPPMM55fiudeQ?pwdkqfz 提取码#xff1a;kqfz Python采集代码下载链接#xff1a;采集代码.zip - 蓝奏云 Bootstrap视频网站模板 …分享112个HTML娱乐休闲模板总有一款适合您   112个HTML娱乐休闲模板下载链接https://pan.baidu.com/s/15uBy1SVSckPPMM55fiudeQ?pwdkqfz  提取码kqfz Python采集代码下载链接采集代码.zip - 蓝奏云 Bootstrap视频网站模板 摇滚音乐娱乐网站模板 音乐唱片公司网站模板 高端桑拿会所响应式模板 import os import shutil import time from time import sleep from docx import Document from docx.shared import Inches from framework.base.BaseFrame import BaseFrame from sprider.business.DownLoad import DownLoad from sprider.business.SeleniumTools import SeleniumTools from sprider.business.SpriderTools import SpriderTools from selenium import webdriver from selenium.webdriver.common.by import By from sprider.model.SpriderEntity import SpriderEntity from sprider.access.SpriderAccess import SpriderAccesstitle_name 娱乐休闲class ChinaZJsSelenium:base_url https://sc.chinaz.com/ # 采集的网址save_path D:\\Freedom\\Sprider\\ChinaZ\\sprider_count 112 # 正在采集第20页的第20个资源共22页资源sprider_start_count 111word_content_list []folder_name page_end_number 0max_pager 24 # 每页的数量haved_sprider_count 0 # 已经采集的数量page_count 1 # 每个栏目开始业务contenttext/html; charsetgb2312filter_down_file []word_image_count 5 # word插入图片数量 同时也是明细采集图片和描述的数量sprider_detail_index 0 # 明细方法采集的数量 累加sprider_top_level HTML 时尚服装博客网站模板 保健与美容网站模板 吉他演奏html网站模板 xbox游戏体验网站模板 绿色保健按摩HTML5模板 度假村房间预订HTML5模板 绿色饮食养生HTML5模板 大气户外摄影HTML5模板 水疗spa会所网站模板 深蓝色音乐演唱会模板 扁平摄影工作室网站模板 音乐活动专题页面模板下载 电影影视门户网站html5模板 多彩音乐演唱会门票官网模板 黑色酷炫乐队网站模板下载 快乐游乐园HTML5网页模板 适合博客新闻网站模板 美容美发会所网站模板 按摩健身绿色网站模板 激情节奏酷炫音乐网站模板 def sprider(self, title_name):采集医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html:return:if title_name 医疗保健:self.first_column_name mobanself.folder_name HTML医疗保健模板self.second_column_name YiLiaoBaoJianelif title_name 娱乐休闲:self.first_column_name mobanself.folder_name HTML娱乐休闲模板self.second_column_name YuLeXiuXianelif title_name 体育竞技:self.first_column_name mobanself.folder_name HTML体育竞技模板self.second_column_name TiYuJingJielif title_name 旅游交通:self.first_column_name mobanself.folder_name HTML旅游交通模板self.second_column_name LvYouJiaoTongelif title_name 电脑主机:self.first_column_name mobanself.folder_name HTML电脑主机模板self.second_column_name DianNaoZhuJielif title_name 电子产品:self.first_column_name mobanself.folder_name HTML电子产品模板self.second_column_name DianZiChanPinelif title_name 电子商务:self.first_column_name mobanself.folder_name HTML电子商务模板self.second_column_name DianZiShangWuBaseFrame().right(本次采集参数日志路径 str(BaseFrame().LOG_PATH) )BaseFrame().right(本次采集参数sprider_count str(self.sprider_count) )BaseFrame().right(本次采集参数title_name title_name )BaseFrame().right(本次采集参数second_column_name self.second_column_name )# self.folder_name JS表单验证self.sprider_category title_name # 一级目录self.folder_namesecond_folder_name str(self.sprider_count) 个 self.folder_name # 二级目录self.sprider_type second_folder_nameself.merchant int(self.sprider_start_count) // int(self.max_pager) 1 # 起始页码用于效率采集# 原始路径一级目录二级目录self.file_path self.save_path os.sep self.sprider_top_level os.sep self.folder_name os.sep second_folder_nameself.save_path self.save_path os.sep self.sprider_top_level os.sep self.folder_name os.sep second_folder_name os.sep self.folder_nameBaseFrame().debug(开始采集ChinaZJL self.folder_name ...)sprider_url (self.base_url /{1}/{0}.html.format(self.second_column_name, self.first_column_name))down_path D:\\Freedom\\Sprider\\ChinaZ\\ self.sprider_top_level \\ self.folder_name \\ second_folder_name \\Temp\\if os.path.exists(down_path) is True:shutil.rmtree(down_path)if os.path.exists(down_path) is False:os.makedirs(down_path)if os.path.exists(self.save_path) is True:shutil.rmtree(self.save_path)if os.path.exists(self.save_path) is False:os.makedirs(self.save_path)chrome_options webdriver.ChromeOptions()diy_prefs {profile.default_content_settings.popups: 0,download.default_directory: {0}.format(down_path)}# 添加路径到selenium配置中chrome_options.add_experimental_option(prefs, diy_prefs)chrome_options.add_argument(--headless) # 隐藏浏览器# 实例化chrome浏览器时关联忽略证书错误driver webdriver.Chrome(optionschrome_options)driver.set_window_size(1280, 800) # 分辨率 1280*800#BaseFrame().debug(开始采集 sprider_url)driver.get(sprider_url)# content driver.page_sourceelement_list driver.find_elements(By.CLASS_NAME, masonry-brick) # 列表页面 核心内容 box col3 ws_block masonry-brick# element_list div_elem.find_elements(By.CLASS_NAME, item)# print(element_list.get_attribute(innerHTML))laster_pager_div driver.find_element(By.CLASS_NAME, fenye)laster_pager_a laster_pager_div.find_elements(By.TAG_NAME, a)laster_pager_url laster_pager_a[len(laster_pager_a) - 2]page_end_number int(laster_pager_url.text)self.page_count self.merchantwhile self.page_count int(page_end_number): # 翻完停止try:if self.page_count 1:self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)passelse:if self.haved_sprider_count self.sprider_count:BaseFrame().debug(采集到达数量采集停止...)BaseFrame().debug(开始写文章...)self.builder_word(self.folder_name, self.word_content_list)BaseFrame().debug(文件编写完毕请到对应的磁盘查看word文件和下载文件)break# (self.base_url /sort/{0}/{1}/.format(url_index, self.page_count))# http://soft.onlinedown.net/sort/177/2/# https://sc.chinaz.com//jianli/xiaochengchu_2.htmlnext_url self.base_url /{2}/{0}_{1}.html.format(self.second_column_name, self.page_count,self.first_column_name)driver.get(next_url)element_list driver.find_elements(By.CLASS_NAME, masonry-brick) # 列表页面 核心内容self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path)pass# print(self.page_count)self.page_count self.page_count 1 # 页码增加1except Exception as e:print(sprider()执行过程出现错误: str(e))sleep(1)水果榨汁饮料店铺网站模板 咖啡蛋糕店加盟网站模板 Music音乐演唱网站模板 HTML5吉他乐器音乐网站模板 豪华酒店介绍预订网站模板 粉色时尚休闲会所网站模板 CSS3餐厅酒店网站模板 HTML5棕色背景新闻模板 咖啡餐厅类目CSS3模板 战争游戏公司网站模板 音乐扬声器娱乐网站模板 水果沙拉甜点网站模板 酒店在线预订网页模板下载 国外视频新闻网站模板 旅行酒店宾馆整站模板下载 音乐生活娱乐网站模板 黑色游戏评测网页模板 宽屏咖啡休闲企业模板 魅力女性时尚网站模板 酒店游泳健身网站模板 电影上映影讯网站模板 蓝色桑拿会所网站模板 紫色风格乐器网站模板 单机游戏网站模板源码 酒店客房预订模板下载 国内外时事政治网站模板 html5视频直播整站模板下载 游戏APP评测网站模板 学佛打坐锻炼网站模板 html5休闲户外网站模板 黄色风格音乐网页模板 榨果汁饮料店网站模板 吉他乐器爱好者网站模板 佳能相机摄影网站模板 休闲果汁饮料网站模板 模特户外拍摄网站模板 欧美时尚休闲网站模板 国外旅游网站模板下载 中医养生按摩网页模板 灯光下的舞台网站模板 粉红色游戏行业网站模版 音乐发烧友HTML5模板 DJ音乐俱乐部网站模板 流行音乐演唱会网站模板 旅游酒店在线预订网站模板 足浴按摩会所CSS模板 时尚咖啡馆静态网页模板 手机游戏门户网站模板 粉色恋爱交友企业网站模板 蓝色沙滩度假休闲网站模板 DJ夜场狂欢HTML网页模板 自行车综合资讯门户网站模板 绿色微酒店预订wap手机模板 游戏评测HTML5网站模板 国际酒店预订网站模板 娱乐资讯HTML5网站模板 咖啡休闲屋HTML网站模板 多彩边框电影资讯网站模板 电影下载网站HTML5模板 手机应用下载wap网站模板 在线音乐试听wap手机模板 奔跑的男孩HTML网页模板 爬山驴友户外网站模板 星巴克咖啡饮品网页模板 咖啡店加盟培训网站模板 咖啡饮品店网站模板 import os import shutildef void_folder(path):# 访问path路径下的文件或文件夹lst os.listdir(path)# 打印每一层的文件或文件夹for name in lst:# 拼接名称得到绝对路径判断该文件是否符合是文件夹real_path os.path.join(path, name)# 如果是文件夹则打空格表示并且递归访问下一层if os.path.isdir(real_path):# print(name)files os.listdir(real_path)if len(files) 0:print(void_folder()name)shutil.rmtree(real_path)endindex len(real_path) - len(name)real_path real_path[0:endindex]void_folder(real_path)else:void_folder(real_path)# 如果不是文件夹直接打印不再递归访问下一层else:#print(name)pass def void_file(dirPath):dirs os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹返回列表for file in dirs:file_full_name dirPath / filefile_ext os.path.splitext(file_full_name)[-1]if file_ext is None or file_ext:continueif rar str(file_ext.split(.)[1]):os.remove(file_full_name)if zip str(file_ext.split(.)[1]):os.remove(file_full_name)if gz str(file_ext.split(.)[1]):os.remove(file_full_name)if tgz str(file_ext.split(.)[1]):os.remove(file_full_name)# 查找指定文件夹下所有相同名称的文件 def search_file(dirPath, fileName):dirs os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹返回列表for currentFile in dirs: # 遍历列表absPath dirPath / currentFileif os.path.isdir(absPath): # 如果是目录则递归继续查找该目录下的文件search_file(absPath, fileName)elif currentFile fileName:#print(absPath) # 文件存在则打印该文件的绝对路径os.remove(absPath) 五星级酒店HTML5网页模板 明星演唱会网站模板 登山爱好者网站模板 绿色攀岩户外网站模板 蓝色海洋主题网站模板 休闲饮品店CSS网站模板 黑色暗格视频分享网站模板 风车发电科技企业网站模板 台球爱好者HTML5网站模板 炫彩舞台CSS大气模板 摄影爱好者html5网站模板 酒吧夜场CSS网站模板 大气美女麦霸网站模板 手机记录生活网页模板 女性水疗会所网站模板 劲爆dj音乐网站模板 静心打坐健身网站模板 瑜伽健身会馆网站模板 电影票销售网站模板 简洁干净茶餐厅企业模板 瑜伽减肥CSS网站模板 唯美摄影HTML5网站模板 最后送大家一首诗: 山高路远坑深, 大军纵横驰奔, 谁敢横刀立马 惟有点赞加关注大军。
http://www.hkea.cn/news/14429633/

相关文章:

  • 网站建设公司dz000婚庆网站设计说明书
  • 网站怎么设置为可信任网站齐全的赣州网站建设
  • 徐汇制作网站哪家好263企业邮箱登陆入囗
  • 昆明网站推广8888168想学营销策划去哪里学
  • 网站建设包括哪些项目息壤空间怎么上传网站
  • 网站被降权表现徐州网站排名
  • 杂志社网站建设意义免费的网站服务器
  • 网站职能好三网网站
  • 做油和米的网站百度竞价推广账户
  • 建站工具有哪些社区凉山州规划和建设局网站
  • 湘西建设监理协会网站彩票网站做任务拿佣金
  • 长治一般建一个网站需要多少钱云南网站建设哪个好
  • 网站和做游戏设计网站大全免费
  • 网页设计网站页面搜索的代码制作网页小图片
  • 无锡网站 appseo面试常见问题及答案
  • 公司网站asp源码网站开发中使用框架吗
  • 网站建设流量入口网监备案网站更换域名
  • 站内推广方案兰州网站建设哪里好
  • 公司建的是网页还是网站仓库管理 erp
  • 个人做网站备案吗什么网站可以做数据图
  • 三亚兼职招聘信息网站中小企业公司
  • 网站建设服务包含内容网络运维课程
  • 豫建设标去哪个网站网站建设工程师是做什么的
  • 门户网站系统建设项目招标书photoshop网课培训
  • 青岛高端网站建设公司网站推广的方法有sem推广
  • 南京网站开发南京乐识赞包装设计的意义
  • 网站建设基本流程流程图微信公众号和网站建设
  • 网站制作在线版wordpress 段落缩进
  • 教资注册网站网站平台 生态建设
  • 企业产品推广运营公司长沙seo工作室