用dw做的网页如何上传到网站,WordPress 微盘,做网站怎么赚钱 注册,一般网站做推广要多大的带宽和内存正则表达式是什么#xff1f;就是要寻找的数据的规律#xff0c;使用正则表达式的步骤有三
第一#xff0c;寻找规律#xff0c;第二使用正则符号表示规律#xff0c;第三#xff0c;提取信息
看下面的代码
import re
wenzhang (小草偷偷地从土里钻出来#xff0c;嫩…正则表达式是什么就是要寻找的数据的规律使用正则表达式的步骤有三
第一寻找规律第二使用正则符号表示规律第三提取信息
看下面的代码
import re
wenzhang (小草偷偷地从土里钻出来嫩嫩的绿绿的。园子里田野里瞧去密码是200073215一大片一大片满是的。坐着躺着打两个滚踢几脚球赛几趟跑27329915一捉几回迷藏。风轻悄悄的草软绵绵的。)
paqumima re.findall((.*),wenzhang)
paquzhunque re.findall((.*?),wenzhang)
print(paqumima,len(paqumima))
print(paquzhunque,len(paquzhunque))
输出效果为
[200073215一大片一大片满是的。坐着躺着打两个滚踢几脚球赛几趟跑27329915一捉几回迷藏。风轻悄悄的] 1
[200073215, 27329915] 2相关知识
第一行 import re
python中正则表达式的模块就是re所以第一行先导入模块re
第二行wenzhang‘巴拉巴拉巴巴拉拉‘
就是把要提取的文本源文件赋值给一个叫wenzhang的变量当然这个变量名可以自己随便起。
第三行paqumima re.findall((.*),wenzhang)
re是导入的模块
点findall是re模块中的一个方法findall的使用格式是
re.findall‘正则表达式’这是里源文本变量
‘正则表达式’的格式是
‘要爬取文字前面的字符.*要爬取文字后面的字符’
返回的值就是按正则表达式描述的内容。
这里的正则表达式是‘.*’
意思就是从源文本中找以开头的以结尾的部分这一部分就是用.*表示
其中.表示除换行符以外的任何一个字符。
*表示它前面的一个表达式0次到无限次。
但是第三行的正则表达式有个缺点就是以开头以最后一个结尾中间还爬取了好多没用的信息所以我们用了第四行的正则表达式
第四行代码paquzhunque re.findall((.*?),wenzhang)
除了正则表达式多了一个外和第三行代码一模一样从后面输出的效果来看
正则表达式.*表示每一个符合正则表达式的内容。所以后面输出的效果长度也是2也仅仅是输出了表示密码的部分。