当前位置: 首页 > news >正文

重庆企业网站制作哪家好百度知道

重庆企业网站制作哪家好,百度知道,用html做的网站步骤,南京做中英文网站设计前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 完整源码、素材皆可点击文章下方名片获取此处跳转 开发环境: python 3.8 运行代码 pycharm 2022.3 辅助敲代码 requests 发送请求/第三方模块 模块安装:win R 输入cmd 输入安装命令 pip install 模块名 如果…

前言

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章


完整源码、素材皆可点击文章下方名片获取此处跳转


开发环境:

  • python 3.8 运行代码

  • pycharm 2022.3 辅助敲代码

  • requests 发送请求/第三方模块

模块安装:win + R 输入cmd 输入安装命令 pip install 模块名

如果出现爆红 可能是因为 网络连接超时 切换国内镜像源

案例基本思路流程:

一. 思路分析

找到数据来源 如何去采集单个章节的内容

如果是动态加载的数据 通过network去抓包分析

二. 代码实现

  1. 发送请求 通过代码的方式去访问 网站

  2. 获取数据 访问完网址之后 反应 网页代码

  3. 解析数据 提取我们需要用到的信息

  4. 保存数据 打包带走

代码展示

导入模块

import requests     # 发送请求
import re

请求链接

main_url = 'https://****/book_8227/'

换一个章节 下载 ?

只需要获取到所有的章节链接 是不是我们就可以拿到整本小说的内容

html = requests.get(main_url).text
# <dd><a href="(.*?)">.*?</a></dd>
# <dd><a href="(.*?)">.*?</a></dd>
link_list = re.findall('<dd><a href="(.*?)">.*?</a></dd>', html)
for link in link_list:

如何去采集整本小说 / 代码能够实现小说下载通用性

    url = main_url + link

1. 发送请求

    response = requests.get(url)

2. 获取数据

<Response [200]>: 请求成功

    html_data = response.text

3. 解析数据

结构化数据 : json数据 {"":"", "":""} 转成 字典 使用字典取值 / re正则表达式

非结构化数据 : 网页源代码 css/xpath/re

什么是正则?

规则 搜索功能的高级用法

我忘记这中间是什么内容, 也不知道有多长, 还是想要匹配到这一整句话在内容当中出现的位置

.*?: 匹配任意字符 0次或者多次

少女年龄不过十四左右,.*?,不过那张稚气未脱的小脸

    title = re.findall('<h1>(.*?)</h1>', html_data)[0]text = re.findall('<br><br>(.*?)</div>', html_data)[0]

&nbsp; 代表一个空格

    text = text.replace('&nbsp;', ' ')

<br /> 代表一个换行

    text = text.replace('<br />', '\n')text = title + "\n\n\n" + textprint(text)

4. 保存数据

a: 追加写入

w: 覆盖写入

    f = open('斗破苍穹.txt', mode='a', encoding='utf-8')f.write(text)f.close()


尾语 💝

好了,今天的分享就差不多到这里了!

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇

http://www.hkea.cn/news/155773/

相关文章:

  • 珠海建设工程信息网站网络营销百度百科
  • 帮别人做网站推广犯法吗关键词排名网站
  • 建设通网站是政府的么高端网站定制设计
  • 玉溪做网站的公司夸克搜索网页版
  • wordpress导航主题haowseo挂机赚钱
  • 广州做家教的网站深圳网络推广招聘
  • 锐捷网络公司排名seo技术介绍
  • 新圩做网站公司拼多多代运营一般多少钱
  • 免费网站可以做cpa?短视频营销的优势
  • b2b外贸营销型网站如何做电商赚钱
  • 建设无障碍网站seo分析报告怎么写
  • 电子商务网站开发进什么科目模板自助建站
  • 威海市住房和城乡建设局官方网站北京seo营销公司
  • 开网页卡优化关键词排名工具
  • wordpress右侧文章归档东莞公司seo优化
  • 个人网站建设需求说明书免费外链生成器
  • 湖南网站建设的公司排名网页制作网站制作
  • 公司网页网站建设 ppt模板app开发公司排行榜
  • 网站开发yuanmus联合早报 即时消息
  • 为什么只有中国人怕疫情seo 页面
  • 网站开发总结报告十大门户网站
  • 临淄信息港发布信息临沂seo建站
  • 门户网站系统介绍企业推广哪个平台好
  • 免费网站建站排行榜网站策划报告
  • 网站设计的评估最近发生的热点新闻
  • 设建网站广告投放渠道
  • 日ip5000的网站怎么做如何提高网站在搜索引擎中的排名
  • 网站描文本链接怎么做深圳互联网营销
  • 一个服务器做两个网站自己做网站
  • 百草味网站建设的活动方案营销型企业网站有哪些