当前位置: 首页 > news >正文

网站搭建心得体会宿迁东岸网络技术有限公司

网站搭建心得体会,宿迁东岸网络技术有限公司,为了找工作做的前端网站,小程序网站模板网上所有代码都无法完全克隆单个网页#xff0c;不是Css#xff0c;Js下载不下来就是下载下来也不能正常显示#xff0c;只能自己写了#xff0c;记得点赞~ 效果如图#xff1a; 源码与所需的依赖#xff1a; pip install requests pip install requests beautifulsoup4…网上所有代码都无法完全克隆单个网页不是CssJs下载不下来就是下载下来也不能正常显示只能自己写了记得点赞~ 效果如图 源码与所需的依赖 pip install requests pip install requests beautifulsoup4 lxml requests.packages.urllib3.disable_warnings() pip install urllib3 pip install pyOpenSSL requests[security] urllib3[secure]import os import time import requests from urllib.parse import urljoin from bs4 import BeautifulSoup# 配置requests不验证SSL证书 requests.packages.urllib3.disable_warnings() session requests.Session() session.verify False # 不推荐仅用于测试目的def sanitize_filename(filename):return .join(i for i in filename if i not in \/:*?|).split(?)[0]def ensure_dir(file_path):if file_path:directory os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r session.get(url, streamTrue)r.raise_for_status()ensure_dir(local_path)with open(local_path, wb) as f:for chunk in r.iter_content(chunk_size8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(fError downloading {url}: {e})return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources soup.find_all(tag, {attribute: True})for resource in resources:old_url resource[attribute]new_url urljoin(base_url, old_url)local_filename sanitize_filename(new_url.split(/)[-1])local_path os.path.join(dest_folder, sub_folder, local_filename)full_local_path os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] os.path.join(sub_folder, local_filename).replace(\\, /)def save_complete_webpage(url, dest_folder):response session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding response.apparent_encodingsoup BeautifulSoup(response.content, html.parser, from_encodingresponse.encoding)base_url urlupdate_resource_links(soup, img, src, base_url, dest_folder, images)update_resource_links(soup, link, href, base_url, dest_folder, css)update_resource_links(soup, script, src, base_url, dest_folder, js)ensure_dir(os.path.join(dest_folder, index.html))with open(os.path.join(dest_folder, index.html), w, encodingresponse.encoding) as file:file.write(soup.prettify())if __name__ __main__:timestamp str(int(time.time()))[-5:] # 获取当前时间戳的最后5位数字target_url input(请输入网址) # 目标网址destination_folder fdownloaded_website_{timestamp} # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f已完整保存到{destination_folder}文件夹中)
http://www.hkea.cn/news/14278960/

相关文章:

  • 给网站公司做网站找人做设计的网站
  • 江苏城乡建设部网站首页网站做啥内容用户多
  • 常平哪里有招计算机网站开发的微信小程序商城定制开发
  • 谁能给做网站免费字体下载网站
  • 自己建立网站多少钱网站建设销售中遇到的问题
  • 亿通网站建设佛山自动机设备骏域网站建设专家
  • 什么叫展示型网站报名网站建设费用价格
  • 长春网站制作天津网站推广
  • 网站建设服务有哪些方面公司网站制作教程
  • 昆明网站优化网络推广文案有哪些
  • 深圳建设工程交易网官网成都网站排名优化报价
  • 基础微网站开发动态app开发制作在哪里的
  • 域名如何解绑一个网站怎么做网站滑动图片部分
  • 五合一营销型网站网站建设无广告语
  • 徐闻住房与城乡建设局网站wordpress 升级数据库
  • 网站开发googleps做网站首页导航栏
  • 哈尔滨网站建设制作哪家便宜河北网站开发价格
  • 免费素材网站下载网站备案中国开头
  • 免费网站建设解决方案一级造价工程师成绩查询
  • 网站维护教程wordpress按住标题没有显
  • 音乐网站是否可以做浅度链接河源市住房和城乡规划建设局网站
  • 运动类网站旅游网站论文摘要
  • 西安网站搜索引擎优化idc机房
  • 做网站笔记本2014免费做团购网站的软件好
  • 动漫制作和动漫设计哪个好seo赚钱吗
  • 张槎网站建设制作wordpress 更换ip
  • 河北住房和城乡建设厅网站首软件开发app的公司
  • 一些你不知道的网站网站实现功能
  • 怎样才可以知道网站是否优化网站建设内容保障工作个人总结
  • 知识产权教育网站建设百度创建网站吗