当前位置: 首页 > news >正文

宁国网站开发wordpress架设教程

宁国网站开发,wordpress架设教程,芜湖有没有网站建设公司吗,沈阳公司网站利用python的爬虫功能进行信息爬取#xff0c;关键在于源码分析#xff0c;代码相对简单。 1 源代码分析 访问网站#xff0c;按下F12#xff0c;进行元素查找分析。 2 代码实现 from requests import get from bs4 import BeautifulSoupdef getXhuNews(pageNum1):关键在于源码分析代码相对简单。 1 源代码分析 访问网站按下F12进行元素查找分析。 2   代码实现 from requests import get from bs4 import BeautifulSoupdef getXhuNews(pageNum1):获取西华大学新闻信息urlhttp://news.xhu.edu.cn/zhxw/list%d.htm%(pageNum)print(url)responseget(url)if (response.status_code200):print(顺利获取数据)else:print(目的网站无法连接)exit();response.encoding utf8htmlresponse.textsoupBeautifulSoup(html,html.parser)#myTitlesoup.select(.news_title) #根据class查找结点(会找出太多的div)myTitlesoup.find_all(div,{id:wp_news_w6}) #根据div的id查找结点soup BeautifulSoup(str(myTitle),html.parser) #重新构造soupmyTitlesoup.select(.news_title) #根据class查找结点(会找出太多的div) myDatesoup.select(.news_meta) #根据class查找结点print(第%d页%pageNum, ,len(myTitle),条新闻)listDate[] #存储日期listTitle[] #存储标题listHref[] #存储连接for i in myTitle:soup BeautifulSoup(str(i),html.parser) #重新构造soupssoup.select(a) #根据标签获取结点for x in s:listHref.append(x[href]) #获取结点属性值listTitle.append(x.getText()) #获取属性文本for i in myDate:soup BeautifulSoup(str(i),html.parser) #重新构造soupssoup.select(span) #根据标签获取结点for x in s:listDate.append(x.getText()) #获取属性文本#写入文件fileNametext%05d.txt%(pageNum)fopen(fileName,w,encodingutf8)for i in range(len(listDate)):str2%04d%(i1) listDate[i] listHref[i] listTitle[i]\nf.write(str2)f.close()#----------使用样例--------------------------------- for i in range(40,50):getXhuNews(i)
http://www.hkea.cn/news/14384474/

相关文章:

  • 利用html做博客网站专业做网站建设公司哪家好
  • 南京网站建站公司代理网络设置
  • 二级网站怎么在平台上做推广
  • 企业网站建设的层次开发一个app大概需要多少钱
  • 网站实名认证需要什么wordpress大学主题安装
  • 淘宝特价版金融网站排名优化
  • 建设公司网站需要什么技术下载微信并安装到手机
  • 企业网站的视频页如何做狮山网站设计
  • 做网站用什么字体字号殡葬网站建设
  • 彩票网站开发周期ui网站建设站评价
  • 天水 网站建设网站怎么排版
  • 温州人才网站开发中山环保骏域网站建设专家
  • 网站做301重定向怎么做征二级网站建设意见 通知
  • 网站图片如何做水印安徽省卫生计生网站医共体建设
  • 企业网站建设选题的依据及意义自己电脑做电影网站吗
  • 开发购物网站描述上海 网站 备案
  • h5技术建设网站app费用
  • 2017年做那个网站致富南京app软件开发
  • 推荐10个优秀的国外ui设计网站怎样自己做免费网站
  • 合肥市门窗工程在哪个网站接活做哈尔滨网页设计与制作
  • 怎么做国外的网站 卖东西网页定制多少钱
  • 福建建设局网站wordpress彩色标签固定宽度代码
  • 苏州优秀网站设计软文有哪几种类型
  • 网站出现风险如何处理方法做刷机网站赚钱吗
  • 网站建设维护更新wordpress解析完403
  • 成都网站建设企业电子商务网站建设与管理期末考试
  • 校园网站建设招标公告api网站模板
  • 企业做网站需要做哪些工作个人网站的内容
  • 商务网站模板免费下载广州网站建设网站优化网站推广
  • 天津教育学会网站建设wordpress下载站批量