当前位置: 首页 > news >正文

合肥网站制作公司电话做网站免费搭建

合肥网站制作公司电话,做网站免费搭建,百度网站排名哪家好,微网站建设报价方案爬虫Day3 csv和bs4 一、CSV的读和写 1. 什么是csv文件 csv文件叫做#xff1a;逗号分隔值文件#xff0c;像Excel文件一样以行列的形式保存数据#xff0c;保存数据的时候同一行的多列数据用逗号隔开。 2. csv文件的读写操作 1) csv文件读操作 from csv import reader…爬虫Day3 csv和bs4 一、CSV的读和写 1. 什么是csv文件 csv文件叫做逗号分隔值文件像Excel文件一样以行列的形式保存数据保存数据的时候同一行的多列数据用逗号隔开。 2. csv文件的读写操作 1) csv文件读操作 from csv import reader, DictReadera.reader 创建根据文件对象创建对应的reader获取文件内容 with open(files/电影.csv, encodingutf-8, newline) as f:r1 reader(f)print(next(r1))print(list(r1))b.DictReader with open(files/电影.csv, encodingutf-8, newline) as f:r2 DictReader(f)print(next(r2))for x in r2:print(x)2)csv文件写操作 from csv import writer, DictWritera. writer with open(files/student1.csv, w, encodingutf-8, newline) as f:# 1.根据文件对象创建writer对象w1 writer(f)# 2.写入数据# 1)一次写一行w1.writerow([姓名, 性别, 年龄])w1.writerow([小明, 男, 22])# 2)一次写多行w1.writerows([(小花, 女, 18),[张三, 男, 30]])b. DictWriter with open(files/student2.csv, w, encodingutf-8, newline) as f:# 1.根据文件对象创建writer对象w2 DictWriter(f, [姓名, 性别, 年龄])# 2.写入数据# 1)将字典的键作为第一行写入文件w2.writeheader()w2.writerow({姓名: 小明, 性别: 男, 年龄: 22})w2.writerows([{姓名: 小花, 性别: 女, 年龄: 17},{姓名: 小红, 性别: 女, 年龄: 18},{姓名: 张三, 性别: 男, 年龄: 30}])二、bs4 bs4(beautifulsoup4)它基于css选择器的网页解析器 css语法 选择器{属性名1: 属性值2; 属性名2: 属性值2; …} 常见属性color(设置字体颜色)、 background-color(背景颜色)、font-size(字体大小)、width(宽度)、height(高度)、border(边框) 选择器 元素选择器(标签选择器) - 将标签作为选择器选中所有指定的标签 a{} - 选中所有的a标签 p{} - 选中所有的p标签 span{} - 选中所有的span标签 id选择器 - 在标签的id属性前加#作为一个选择器选中id属性值为指定值的标签 注意一个网页中id属性值是唯一的 #a{} - 选中id属性值为a的标签 #b1{} - 选中id属性值为b1的标签 class选择器 - 在标签的class属性前加.作为一个选择器选中所有class属性值为指定值的标签 注意一个网页中多个标签的class属性值可以相同同一个标签可以有多个不同的class 只有一个class属性值标签的写法标签名 class“c1” 有多个class属性值标签的写法标签名 class“c1 c2 c3” .a{} - 选中class属性值为a标签 .c1{} - 选中class属性值为c1的标签 .a.b{} - 选中class属性值同时为a和b标签 a.c1{} - 选中所有class值为c1的a标签 子代选择器 - 将两个选择器用连接成一个选择器前后形成父子关系 diva{} - 选中所有在div标签中的a标签a标签必须是div的子标签 后代选择器 - 将两个选择器用空格连接成一个选择器(前后形成后代关系 div a{} - 选中所有在div标签中的a标签a标签必须是div的后代标签 注意安装的时候装beautifulsoup4使用的时候用bs4 from bs4 import BeautifulSoup1.根据网页源代码创建soup对象 BeautifulSoup(网页源代码, ‘lxml’) f open(files/data.html, encodingutf-8) soup BeautifulSoup(f.read(), lxml) f.close()2. 获取标签 soup对象.select(css选择器) - 获取整个网页中选择器选中的所有标签返回值是一个列表列表中的元素是标签对象找不到返回空列表 soup对象.select_one(css选择器) - 获取整个网页中选择器选中的第一个标签返回值是标签对象(找不到返回None) 标签对象.select(css选择器) - 获取指定标签中css选择器选中的所有标签 标签对象.select_one(css选择器) - 获取指定标签中css选择器选中的第一个标签 result soup.select(p) print(result)# result soup.select(.c1) # print(result) # # result soup.select_one(p) # print(result) # # result soup.select(div p) # print(result)box1 soup.select_one(#box1) result box1.select(p) print(result)p1 soup.select_one(spanp) a1 box1.select_one(a)3. 获取标签内容和标签属性 标签对象.text - 获取标签内容 标签对象.attrs[属性名] - 获取标签指定属性的值 print(p1.text) # 我是段落5 print(a1.text) # 我是超链接3 print(a1.attrs[href]) # https://www.baidu.com应用 import requests from bs4 import BeautifulSoup# 1. 获取网页源代码 headers {user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.0.0 Safari/537.36 } response requests.get(https://movie.douban.com/top250, headersheaders) html response.text# 2. 解析数据 soup BeautifulSoup(html, lxml)# 获取每个电影对应的div div_list soup.select(.grid_viewlidiv) for x in div_list:name x.select_one(.title).textscore x.select_one(.rating_num).textcomment x.select(.starspan)[-1].text[:-3]print(name, score, comment)
http://www.hkea.cn/news/14452924/

相关文章:

  • 学校网站英文鲅鱼圈规划建设局网站
  • 1m带宽网站支持多少人同时在线学院网站建设实例
  • 某集团网站建设规划书免费html网页源代码
  • wordpress网站数据库备份凡科网注册
  • 中职网站建设溧阳市建设局网站
  • 做企业展示网站怎么把自己做的网页生成链接
  • 公司网站建立的建议网站介绍页面
  • 天津seo管理平台seo入门视频
  • 网站如何动态修改主页手机软件分类
  • 云南网官方网站烟台企业宣传片制作公司
  • 网站备案 个体工商户折叠彩页设计
  • 企业如何推广网站西乡网站建设
  • 网站上飘窗怎么做怎么做网站统计
  • 建设网站前的需求分析wordpress 判断置顶
  • 韶关做网站公司网站开发技术案例
  • 漳州正规网站建设价格企业年报网上申报系统网址
  • 网站虚拟主机销售制作网站一般多少钱
  • 专用主机方式建设网站centos建立wordpress
  • 福建设备公司网站树莓派做网站
  • 网站搭建软件d中国化工网网站建设建议
  • 运营网站软件开发模型及特点
  • 获取网站访客qq号码网站编程培训哪好
  • 如何申请一个网站 做视频洛阳微网站建设
  • 手机制作gif宁波seo快速优化平台
  • 做网站有回扣拿吗太原企业网站seo
  • 怎么发现网站漏洞而做软件巢湖有没有专门做网站的公司
  • wordpress 角色宁波seo网络推广推荐公众号
  • 用flash做网站教程做网站拿来卖
  • 怎么做素材设计网站成都做小程序的公司排名
  • 网站后台用esayui做新华网