当前位置：首页 > news >正文

台州网站制作台州网站建设珠海百度推广优化排名

news 2026/4/6 18:20:33

台州网站制作台州网站建设,珠海百度推广优化排名,顺德品牌网站,做网站营销怎么去推广文章目录导入模块相关语法实战导入模块 from lxml import etree相关语法 XPath（XML Path Language）是一种用于在XML文档中定位和选择元素的语言。XPath的主要应用领域是在XML文档中进行导航和查询，通常用于在XML中选择节点或节点集合。以…

在这里插入图片描述

文章目录

导入模块
相关语法
实战

导入模块

from lxml import etree

实战

解析的话，我们是对网站的发送的请求所传回的对象的text 进行解析
对于xpath 进行寻找得到，加上text()就可以输出文本
对于xpath 查找的得到的，加上@属性名 就可以返回相关的属性值
为了使用方便，常常用//来选择结点,用[@ class = " "]来具体根据属性筛选，对于同一个路径下，多个平行的内容，可以在[@ class = " "]之后加上[ number]来具体选择，注意，这个number 为具体第几个，从1开始
注意xpath 返回的对象为列表

以网站https://ssr1.scrape.center/为例子
我们先爬取该网站的电影名字
在这里插入图片描述
通过看网页的源码，发现在

标签下，class = “m-b-sm”

import requests
from lxml import etreeheaders ={"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}responce = requests.get(r'https://ssr1.scrape.center/',headers = headers)html = etree.HTML(responce.text)allname = html.xpath(r'//h2[@class="m-b-sm"]/text()')
for name in allname:print(name)