当前位置：首页 > news >正文

晋州网站建设网络推广南王科技：美方裁定公司

news 2026/4/30 12:11:51

晋州网站建设网络推广,南王科技：美方裁定公司,赣州91人才网官网,中企动力做网站服务怎么样分享96个HTML体育竞技模板#xff0c;总有一款适合您 96个HTML体育竞技模板下载链接#xff1a;https://pan.baidu.com/s/1k2vJUlbd2Boduuqqa0EWMA?pwdj8ji 提取码#xff1a;j8ji Python采集代码下载链接#xff1a;采集代码.zip - 蓝奏云北京奥运火炬PSD模板奥运…分享96个HTML体育竞技模板总有一款适合您 96个HTML体育竞技模板下载链接https://pan.baidu.com/s/1k2vJUlbd2Boduuqqa0EWMA?pwdj8ji 提取码j8ji Python采集代码下载链接采集代码.zip - 蓝奏云北京奥运火炬PSD模板奥运火炬PSD模板 TM 运动模板FLASH 足球网站模板高尔夫网站模板帆船网站模板 TM 保龄球模板FLASH TM 足球模板FLASH TM 高尔夫模板FLASH 溜冰网站模板网球网站模板运动网站模板划雪公司模板欧美高尔夫模板欧美足球模板下载跳伞网站模板欧美排球模板韩国冲浪模板世界杯韩国模板四世界杯韩国模板五世界杯韩国模板三世界杯韩国模板二世界杯韩国模板一 Helendesign 游泳模板冲浪商务模板下载棒球公司模板篮球公司网站模板高尔夫企业网站模板漂流网站模板高尔夫俱乐部模板 import os import shutil import time from time import sleep from docx import Document from docx.shared import Inches from framework.base.BaseFrame import BaseFrame from sprider.business.DownLoad import DownLoad from sprider.business.SeleniumTools import SeleniumTools from sprider.business.SpriderTools import SpriderTools from selenium import webdriver from selenium.webdriver.common.by import By from sprider.model.SpriderEntity import SpriderEntity from sprider.access.SpriderAccess import SpriderAccesstitle_name 体育竞技class ChinaZJsSelenium:base_url https://sc.chinaz.com/ # 采集的网址save_path D:\\Freedom\\Sprider\\ChinaZ\\sprider_count 113 # 正在采集第20页的第20个资源共22页资源sprider_start_count223word_content_list []folder_name page_end_number0max_pager24#每页的数量haved_sprider_count 0 # 已经采集的数量page_count 1 # 每个栏目开始业务contenttext/html; charsetgb2312filter_down_file[]word_image_count5 #word插入图片数量同时也是明细采集图片和描述的数量sprider_detail_index 0# 明细方法采集的数量累加sprider_top_levelHTML欧美棒球网站模板运动企业模板下载球队网站模板 Designload 足球模板跑步企业网站模板冲浪网站模板足球俱乐部模板足球网站模板下载 Helendesign 网球模板 Helendesign 高尔夫模板 Helendesign 橄榄球模板 Helendesign 滑板模板 Helendesign 跑步模板 Helendesign 冰球模板 Helendesign 棒球模板 Helendesign 滑雪模板 Helendesign 自行车模板 Helendesign 体育模板 InstantCoffee 运动模板 Boxedart 橄榄球模板 Aplustemplates 足球模板 Aplustemplates 冲浪模板 Aplustemplates 高尔夫模板 Helendesign 划船模板 Templatesdd 摔跤模板 def sprider(self,title_name):采集医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html:return:if title_name 医疗保健:self.first_column_name mobanself.folder_name HTML医疗保健模板self.second_column_name YiLiaoBaoJianelif title_name 体育竞技:self.first_column_name mobanself.folder_name HTML体育竞技模板self.second_column_name TiYuJingJielif title_name 旅游交通:self.first_column_name mobanself.folder_name HTML旅游交通模板self.second_column_name LvYouJiaoTongelif title_name 电脑主机:self.first_column_name mobanself.folder_name HTML电脑主机模板self.second_column_name DianNaoZhuJielif title_name 电子产品:self.first_column_name mobanself.folder_name HTML电子产品模板self.second_column_name DianZiChanPinelif title_name 电子商务:self.first_column_name mobanself.folder_name HTML电子商务模板self.second_column_name DianZiShangWuBaseFrame().right(本次采集参数日志路径 str( BaseFrame().LOG_PATH) )BaseFrame().right(本次采集参数sprider_count str(self.sprider_count) )BaseFrame().right(本次采集参数title_nametitle_name)BaseFrame().right(本次采集参数second_column_name self.second_column_name )# self.folder_name JS表单验证self.sprider_category title_name # 一级目录self.folder_namesecond_folder_name str(self.sprider_count) 个 self.folder_name #二级目录self.sprider_type second_folder_nameself.merchantint(self.sprider_start_count) //int(self.max_pager)1 #起始页码用于效率采集#原始路径一级目录二级目录self.file_path self.save_path os.sep self.sprider_top_level os.sep self.folder_name os.sep second_folder_nameself.save_path self.save_path os.sep self.sprider_top_level os.sepself.folder_name os.sep second_folder_name os.sep self.folder_nameBaseFrame().debug(开始采集ChinaZJLself.folder_name...)sprider_url (self.base_url /{1}/{0}.html.format(self.second_column_name,self.first_column_name))down_pathD:\\Freedom\\Sprider\\ChinaZ\\self.sprider_top_level \\self.folder_name \\second_folder_name\\Temp\\if os.path.exists(down_path) is True:shutil.rmtree(down_path)if os.path.exists(down_path) is False:os.makedirs(down_path)if os.path.exists(self.save_path ) is True:shutil.rmtree(self.save_path )if os.path.exists(self.save_path ) is False:os.makedirs(self.save_path )chrome_options webdriver.ChromeOptions()diy_prefs {profile.default_content_settings.popups: 0,download.default_directory:{0}.format(down_path)}# 添加路径到selenium配置中chrome_options.add_experimental_option(prefs, diy_prefs)chrome_options.add_argument(--headless) #隐藏浏览器# 实例化chrome浏览器时关联忽略证书错误driver webdriver.Chrome(optionschrome_options)driver.set_window_size(1280, 800) # 分辨率 1280*800#BaseFrame().debug(开始采集sprider_url)driver.get(sprider_url)# content driver.page_sourceelement_list driver.find_elements(By.CLASS_NAME, masonry-brick) # 列表页面核心内容 box col3 ws_block masonry-brick#element_list div_elem.find_elements(By.CLASS_NAME, item)#print(element_list.get_attribute(innerHTML))laster_pager_div driver.find_element(By.CLASS_NAME, fenye)laster_pager_a laster_pager_div.find_elements(By.TAG_NAME, a)laster_pager_url laster_pager_a[len(laster_pager_a) - 2]page_end_number int(laster_pager_url.text)self.page_countself.merchantwhile self.page_count int(page_end_number): # 翻完停止try:if self.page_count 1:self.sprider_detail(driver,element_list,self.page_count,page_end_number,down_path)passelse:if self.haved_sprider_count self.sprider_count:BaseFrame().debug(采集到达数量采集停止...)BaseFrame().debug(开始写文章...)self.builder_word(self.folder_name, self.word_content_list)BaseFrame().debug(文件编写完毕请到对应的磁盘查看word文件和下载文件)break#(self.base_url /sort/{0}/{1}/.format(url_index, self.page_count))#http://soft.onlinedown.net/sort/177/2/#https://sc.chinaz.com//jianli/xiaochengchu_2.htmlnext_url self.base_url /{2}/{0}_{1}.html.format(self.second_column_name, self.page_count,self.first_column_name)driver.get(next_url)element_list driver.find_elements(By.CLASS_NAME, masonry-brick) # 列表页面核心内容self.sprider_detail( driver, element_list, self.page_count, page_end_number, down_path)pass#print(self.page_count)self.page_count self.page_count 1 # 页码增加1except Exception as e:print(sprider()执行过程出现错误: str(e))sleep(1) 棒球网站模板体育网站模板欧美棒球模板橄榄球网站模板橄榄球公司模板滑雪网站模板下载爬山企业模板赛马竞技模板体育企业网站模板跑步商务网站模板冰球网站模板登山公司网站模板爬山俱乐部模板自行车网站模板欧美登山网站模板运动网站模板下载冲浪公司网站模板网球网站模板下载足球企业网站模板运动企业网站模板足球赛场网站模板篮球网站模板 import os import shutildef void_folder(path):# 访问path路径下的文件或文件夹lst os.listdir(path)# 打印每一层的文件或文件夹for name in lst:# 拼接名称得到绝对路径判断该文件是否符合是文件夹real_path os.path.join(path, name)# 如果是文件夹则打空格表示并且递归访问下一层if os.path.isdir(real_path):# print(name)files os.listdir(real_path)if len(files) 0:print(void_folder()name)shutil.rmtree(real_path)endindex len(real_path) - len(name)real_path real_path[0:endindex]void_folder(real_path)else:void_folder(real_path)# 如果不是文件夹直接打印不再递归访问下一层else:#print(name)pass def void_file(dirPath):dirs os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹返回列表for file in dirs:file_full_name dirPath / filefile_ext os.path.splitext(file_full_name)[-1]if file_ext is None or file_ext:continueif rar str(file_ext.split(.)[1]):os.remove(file_full_name)if zip str(file_ext.split(.)[1]):os.remove(file_full_name)if gz str(file_ext.split(.)[1]):os.remove(file_full_name)if tgz str(file_ext.split(.)[1]):os.remove(file_full_name)# 查找指定文件夹下所有相同名称的文件 def search_file(dirPath, fileName):dirs os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹返回列表for currentFile in dirs: # 遍历列表absPath dirPath / currentFileif os.path.isdir(absPath): # 如果是目录则递归继续查找该目录下的文件search_file(absPath, fileName)elif currentFile fileName:#print(absPath) # 文件存在则打印该文件的绝对路径os.remove(absPath) 竞技赛马网站模板欧美足球公司模板足球企业模板欧美运动网站模板武术俱乐部模板棒球竞技网站模板足球竞技网站模板高尔夫球场网站模板保龄球网站模板柔道网站模板瑜伽网站模板休闲钓鱼网站模板健身网站模板下载滑雪网站模板高尔夫网站模板下载欧美自行车网站模板欧美水球模板高尔夫模板下载欧美网球模板最后送大家一首诗: 山高路远坑深, 大军纵横驰奔, 谁敢横刀立马惟有点赞加关注大军。

查看全文

http://www.hkea.cn/news/14474784/