当前位置: 首页 > news >正文

十大网站app排行榜cn域名与com域名

十大网站app排行榜,cn域名与com域名,做搜索引擎的网站,公司注册资金可以变更减少吗Python爬虫:下载人生格言 爬取网页 将这些格言下载存储到本地 代码: import requests #导入requests库#xff0c;用于提取网页 from lxml import etree#导入lxml库#xff0c;用于Xpath数据解析#请求头 header{ user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) A…Python爬虫:下载人生格言 爬取网页 将这些格言下载存储到本地 代码: import requests #导入requests库用于提取网页 from lxml import etree#导入lxml库用于Xpath数据解析#请求头 header{ user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0 }#每个浏览器的user-agent不一样在浏览器中查找urlhttp://m.3chongmen.com/renshenggeyan/162.html#请求网址 res1requests.get(urlurl,headersheader).text htmletree.HTML(res1) titlehtml.xpath(//div[classtitle]/h1/text())[0]#数据解析提取标题 contenthtml.xpath(//div[classcontent]/text())#数据解析提取内容 content.join(content) print(title) print(content)运行结果: 分析: 导入requests库 requests库是第三方库要提前安装 输入指令进行安装 pip install requests*导入lxml库 输入指令 pip install lxmlheaders 最简单的只用加上user-agent就可以了 鼠标右键选择”检查“点击”网络“ctrlR刷新页面点击第一份文件点击”标头“滑到最下方查找”User-Agent“,复制到pycharm中即可 数据解析Xpath 用requets获取的源代码如图想要的信息就在这里面我们需要提取出来因此就要用到Xpath进行解析要先学习一下Xpath语法和lxml库的使用可以在网上查找相关资料 拓展 将目录下的所有人生格言提取并保存在本地 代码 import requests from lxml import etreeheader{ user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0 }def spider(url):res1requests.get(urlurl,headersheader).texthtmletree.HTML(res1)contenthtml.xpath(//div[classcontent]/text())content.join(content)titlehtml.xpath(//div[classtitle]/h1/text())[0]return title,contenturl1http://m.3chongmen.com/renshenggeyan resrequests.get(urlurl1,headersheader).text htmletree.HTML(res) linkshtml.xpath(//ul[classlist_cnt]//a[target_blank]/href)for link in links:title,contentspider(link)with open(f格言/{title}.txt,w,encodingutf-8) as f:f.write(title\n\n)f.write(content)运行结果:
http://www.hkea.cn/news/14355887/

相关文章:

  • 哪个网站可以做封面想自己建一个公司网站怎么做
  • 中原彼得堡航空学院网站的建设做网站找哪个公司好
  • 如何介绍网站模板下载公司内部小程序开发公司
  • 自主免费建站网站wordpress退出代码
  • 设计电子商务网站建设方案asp网络公司程序 网站公司企业建设源码 网站设计模板seo优化
  • 毕业设计 旅游网站建设网络营销推广活动方案
  • 彩票网站开发制作需要什么建设网站上申请劳务资质吗
  • 河南微网站建设公司哪家好上海网站建设服务商
  • 网站备案证书下载密码忘了英语课件做的好的网站
  • 网站制作源码版权网页开发工具软件
  • 潍坊网站制作公司哪家比较好关键词优化技巧有哪些
  • 做网站优化有什么途径自适应企业网站源码
  • 泰安集团网站建设公司seow
  • 网站建设收费标准公司手机网站 生成app
  • 四川哪家网站做的最好游戏推广代理加盟
  • 海城 网站建设三合一商城网站
  • 哪些网站可以做外部锚文本wordpress在线安装插件在哪里
  • 松江网站开发培训班成都建筑网站建设
  • 福甭市建设局网站顺企网下载
  • wordpress建站专家wordpress 跳转 文章
  • 做养生的网站多吗用什么编辑wordpress
  • 宜昌市做网站WordPress数字商城模板
  • 网站框架优化淮北论坛租房信息
  • 下载建网站主题字体wordpress
  • wordpress 手工网站广州交易中心
  • 电子商务网站怎么建设济阳网站建设公司
  • 厦门市建设局网站住房保障网站建设微信文章
  • 叮当设计网站wordpress制作海报
  • 软件园二期做网站的公司有哪些wordpress 编写文章
  • 物流那个网站做推广好企业解决方案平台