当前位置: 首页 > news >正文

网站建设需要哪些网站开发需要哪些资料

网站建设需要哪些,网站开发需要哪些资料,极品wordpress素材教程网站,东莞app制作公司python爬虫-bs4 目录 python爬虫-bs4说明安装导入 基础用法解析对象获取文本Tag对象获取HTML中的标签内容find参数获取标签属性获取所有标签获取标签名嵌套获取子节点和父节点 说明 BeautifulSoup 是一个HTML/XML的解析器#xff0c;主要的功能也是如何解析和提取 HTML/XML 数…python爬虫-bs4 目录 python爬虫-bs4说明安装导入 基础用法解析对象获取文本Tag对象获取HTML中的标签内容find参数获取标签属性获取所有标签获取标签名嵌套获取子节点和父节点 说明 BeautifulSoup 是一个HTML/XML的解析器主要的功能也是如何解析和提取 HTML/XML 数据 在爬虫项目中经常会遇到不规范、及其复杂的HTML代码 BeautifulSoup4提供了强大的方法来遍历文档的节点以及根据各种条件搜索和过滤文档中的元素。你可以使用CSS选择器、正则表达式等灵活的方式来定位和提取所需的数据 安装 pip install BeautiifulSoup4导入 from bs4 import BeautifulSoup基础用法 解析对象 soup BeautifulSoup(目标数据,解析器)目前有三种主流解析器 html.parserlxml(推荐)html5lib 获取文本 获取文本的方法两种方式text和contents contents from bs4 import BeautifulSoupdata h1Welcome to BeautifulSoup Practice/h1div classarticleh2Article Title/h2pThis is a paragraph of text for practicing BeautifulSoup./pa hrefhttps://www.example.comLink to Example Website/asoup BeautifulSoup(data, lxml) print(soup.contents) # 输出[htmlbodyh1Welcome to BeautifulSoup Practice/h1 div classarticle h2Article Title/h2 pThis is a paragraph of text for practicing BeautifulSoup./p a hrefhttps://www.example.comLink to Example Website/a /div/body/html]text print(soup.text)Welcome to BeautifulSoup PracticeArticle Title This is a paragraph of text for practicing BeautifulSoup. Link to Example WebsiteTag对象 获取HTML中的标签内容 比如p div 示例 print(soup.h2) # h2Article Title/h2print(soup.h2.text) # Article Titlefind参数 获取class要加下划线因为在python中它属于关键字除了class还可以换成任意属性名 data h1Welcome to BeautifulSoup Practice/h1div classarticlepThis is a paragraph of text for practicing BeautifulSoup./p/divdiv classex2pThis is a abcd./p/divsoup BeautifulSoup(data, lxml) print(soup.find(div, class_article))获取标签属性 data p id appleThis is a paragraph of text for practicing BeautifulSoup./p soup BeautifulSoup(data, lxml) tag soup.find(p) print(tag.get(id)) # apple获取所有标签 soup BeautifulSoup(data, lxml) print(soup.find_all(p)) # [pThis is a paragraph of text for practicing BeautifulSoup./p, pThis is a abcd./p]print(len(soup.find_all(p))) # 2括号为空则获取全部标签 获取标签名 print(soup.div.name) # div嵌套获取 示例HTML如下 html div classarticleh2Article Title/h2pThis is a paragraph of text for practicing BeautifulSoup./ppThis is a abcd./pa hrefhttps://www.example.comLink to Example Website/a /div目标获取div下的所有p标签内容 print(soup.find(div, class_article).find_all(p))子节点和父节点 soup BeautifulSoup(data, lxml) # 遍历获取所有父节点 for item in soup.p.parents:print(item)# 遍历获取所有子节点 for i in soup.p.children:print(soup.p.children)
http://www.hkea.cn/news/14535966/

相关文章:

  • 茶叶网站建设策划方案u001fwordpress 启动wordpress mu
  • 网站建设 程序开发网站备案工信部时间
  • 企业手机端网站源码下载生活服务网站开发
  • 江西建设门户网站网站开发常见技术问题
  • 建设银行怎么从网站上改手机号码买链接
  • 小学校园网站建设简介wordpress 新建模板文件夹
  • 网站建设服务ysaigo企业网站管理系统最新4湖南岚鸿牛x1 0
  • jsp网站连接数据库wordpress大学主题安装
  • 自己可以免费做网站吗不做网站做百家号
  • 做网站游戏推广赚钱吗农业网站设计
  • 织梦网站修改首页图片谷歌seo和百度seo区别
  • 网站开发工作总结论文app注册推广任务平台
  • 上海网站建设建站织梦网站站标
  • 威海营销型网站建设陕西住房城乡建设厅网站
  • 在百度上建网站做网站配置服务器
  • 上海网站推广很好上海电信网站备案
  • 动漫网站建设前期策划成都网站开发公司哪家好
  • 网站模板套餐做网站本溪
  • 成都网站推广公司小羚羊网站怎么建设
  • 中山蓝图科技网站建设芜湖做网站建设公司
  • 网站建设 招聘粤健康app下载
  • 长春企业网站设计贵州百度竞价网页设计
  • asp网站图片万网做网站给网站源码
  • 公司付网站会员费科目怎么做私募基金网站建设要求
  • 银川网站建设效果最新做做网站
  • 外贸网站建设 佛山做片头 网站
  • 网站怎么做外链接地址自己制作游戏的软件
  • jsp网站开发工资域名访问网站下
  • 在哪可以建一个网站网站建设感悟
  • 个人备案网站可以做商城展示开发公司网站