当前位置: 首页 > news >正文

网站模板和源码区别互联网营销师有什么用

网站模板和源码区别,互联网营销师有什么用,网红营销的特点,简述网站设计的原则1基本理论 1.1概念体系 网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等#xff0c;可以按照我们设置的规则自动化爬取网络上的信息#xff0c;这些规则被称为爬虫算法。是一种自动化程序#xff0c;用于从互联网上抓取数据。爬虫通过模拟浏览器的行为#xff0c;访问网页并…1基本理论 1.1概念体系 网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等可以按照我们设置的规则自动化爬取网络上的信息这些规则被称为爬虫算法。是一种自动化程序用于从互联网上抓取数据。爬虫通过模拟浏览器的行为访问网页并提取信息。这些信息可以是结构化的数据如表格数据也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。 1.2技术体系 1请求库:用于向目标网站发送HTTP请求。常用的请求库包括requests、httplib、urllib等。这些库可以帮助我们模拟浏览器行为发送GET、POST等请求并处理响应内容。 2.解析库用于解析HTML或XML文档提取出我们需要的数据。常用的解析库包括BeautifulSoup、lxml、pyquery等。这些库可以帮助我们根据HTML文档的结构和标签提取出我们需要的数据。 3.存储库用于将爬取到的数据存储到本地或数据库中。常用的存储库包括sqlite3、mysql-connector-python、pymongo等。这些库可以帮助我们将数据存储到关系型数据库或非关系型数据库中以便后续分析和利用。 2.代码编写流程 代码编写流程 代码共分为4部分1网页数据抓包。2json数据地址规律3json数据解析数据存储。 2.1.网页抓包与地址规律 通过网页抓包解析到json数据。 加入该网页红色线框中的数据是要爬取的数据 网页地址https://app.zhuanzhuan.com/zzopen/sellbook/pcHomePageList?pageNum1pageSize20cateId2100cateId3100 对网页刷新发现抓包的数据增加如下图 Json数据如下 网页地址 https://app.zhuanzhuan.com/zzopen/sellbook/pcHomePageList?pageNum2pageSize20cateId2100cateId3100 对上面地址分析发现地址中pageNum数值发生改变第一页位数为1第二页位数为2 依次类推。 编写翻页函数 函数中为中pageNum页面地址位数 2.2.页面解析 2.3.网页数据保存 · 3.应用举例 输出结果 通过上面代码测试输出结果为每本书的相关数据利用json查找语法解析json数据将书籍书籍写入excel数据表中 4.编写代码 import requests from openpyxl import Workbook,load_workbook import os import jsonpath import json def wy_text(x):resrequests.get(urlhttps://app.zhuanzhuan.com/zzopen/sellbook/pcHomePageList?pageNum{}pageSize20cateId2100cateId3100.format(x))sssjson.loads(res.text)return sss class Excel_write():def __init__(self):self.excel_file 转转图书信息.xlsxif not os.path.exists(self.excel_file):self.wk Workbook();#创建excel工作薄self.wk.create_sheet(图书信息,0);#sheet表名位置(从0开始)# 默认选择当前活跃选项卡self.wb self.wk[图书信息]self.wb.append([书名,出版社,出版日期,价格]);#横向插入数据self.wk.save(self.excel_file)self.wk_load load_workbook(filenameself.excel_file)self.wb_load self.wk_load[图书信息]def nr1(self,text):nr_text[]p1jsonpath.jsonpath(text,$.respData..title)p3jsonpath.jsonpath(text,$.respData..publisher)p4jsonpath.jsonpath(text,$.respData..pubdate)p5jsonpath.jsonpath(text,$.respData)for i in range(len(p1)):nr_text.append([p1[i],p3[i],p4[i],p5[0][i][sellPrice]/100])return nr_textdef nr_write(self):for i in range(1,40):swy_text(i)#类中调用外部函数listExcel_write().nr1(s)#类中函数相互调用注意外部或内部self参数都不用加for k in range(len(list)):self.wb_load.append(list[k])self.wk_load.save(filenameself.excel_file) if __name____main__: Excel_write().nr_write()运行结果
http://www.hkea.cn/news/14290414/

相关文章:

  • 做网站的利与弊做班级玩网站做哪些方面
  • 学校网站建设哪家好淮安市哪里有做网站
  • 梅花手表网站个人网站建设方案模板
  • 江苏省华建建设股份有限网站wordpress 优秀的博客主题简洁
  • 提供网站技术网站服务器过期了
  • 可以建微信网站的搜索 龙岩网
  • 网站优化排名软件网郑州公司网站建设哪家好
  • 做的比较好的冷柜网站有哪些百度行业网站怎么做
  • flash网站开发教程mitao wordpress
  • 网站制作多少钱公司微信注册账号申请
  • 东莞市建设工程质监督站网站网站建设咨询哪些方面
  • 网站备案需要审核多久seo教程从零开始
  • 怎么在年报网站做简易注销网站建设交接协议书
  • 江苏建设网站公司wordpress中文链接404
  • 网站开发工程师面试问题易搜搜索引擎
  • 河南住房和城乡建设厅网站首页网站建设叫什么软件
  • 检察院网站建设wordpress 无法编辑主题
  • 广东网站开发网站开发设计费用
  • 提供网站建设备案公司微信seo是什么意思
  • 设计网站的意义网站的功能建设
  • 赣州网站建设jxgzg3怎么做营销推广方案
  • 网站建设公司销售前景一般网站建设公司怎么收费
  • 网站模板 wordpress仿美团网站开发
  • 正规品牌网站设计推荐全国甲级建筑设计院名单
  • 企业网站开发注意什么纯静态网站制作
  • 云南云南省城乡建设厅网站wordpress ssl 图片
  • 免费发布信息网站网址大全如何设计一个网络
  • 如何做产品网站昆明广告设计与制作公司
  • 网站建设经费管理广西网络
  • 珠海做网站找哪家好网站ui需求