当前位置: 首页 > news >正文

酒店网站建设方案策划网站建设专

酒店网站建设方案策划,网站建设专,平阴网络营销是什么,自建站 外贸#xff08;注#xff1a;本文为小报童精选文章#xff0c;已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费#xff09; 想采集网页数据却不会写 Python 爬虫#xff1f;不会就不会吧#xff0c;ChatGPT 会就可以了 #x1f602; 问题描述 朋友最近遇到了一点儿… 注本文为小报童精选文章已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费 想采集网页数据却不会写 Python 爬虫不会就不会吧ChatGPT 会就可以了 问题描述 朋友最近遇到了一点儿技术障碍找我帮忙。起因是他想获取一个网站上面的信息。 一般网站的信息获取起来并不麻烦。怕就怕这种网站 —— 活动通知。 要知道过期的活动是没有什么「通知」的意义的。所以网站对于过期活动的态度比较明确 —— 直接删掉。所以主页面的内容是每天甚至每个小时都会改变的。 刚才的图片是今天早上网站的内容而下面这个是前几天他保存的页面存档内容。 他发现不仅主页上面活动列表里过期活动信息找不到了就连存档里过期活动的链接也全都点不开了。 痛定思痛他决心干脆每天把当日的活动信息都弄下来。可是他又不懂 Python 爬虫技术。每天分别手动摘取活动的名称、日期、时间、地点、URL以及还得打开对应 URL 拷贝其中的活动描述正文内容实在是太麻烦了。 一天两天还好说如果要坚持一年那可就是愚公移山的精神了…… 所以他找我求助。 这种事儿吧「会者不难难者不会」。我虽然曾经写过简单的爬虫教程但是也已经很久没有摸索了。现在不仅手生也没有时间去对要提取的各项信息一一定位、抽取觉得太过繁琐。 好在咱们不是有 ChatGPT 吗 本文我就给你演示一下如何用 ChatGPT 来帮助咱们从网页上把想要的信息抽取出来。 脾性 ChatGPT 的每一个模式都有自己的「脾性」。其中 Advanced Data Analysis 的脾性重要的是以下两点 无法联网。所以你不要指望它能够获得最新的 API 也不要希望它能够帮你下载任何东西。这里「任何东西」当然包括网页也包括 ChatGPT 的 Advanced Data Analysis 模式虚拟机中未安装的软件包。很多读者反馈给我说是 scikit-learn 机器学习框架在 Advanced Data Analysis 里面能用但是 Tensorflow 不能用也装不上。就是这个原因能上传数据。你可以把数据直接喂给它。这样它在进行分析的时候可以有非常强烈的上下文。 这里我们着重说说第二点。假设我们让 ChatGPT 「去帮我把一个网页中的日期、时间、地点、活动名称、URL 爬取下来」它因为啥都看不到多半会根据经验给你胡写一个根本不能用的结果。而对于一个输入数据文件作为样例情况就会好很多。 只不过网页里面一般也有很多内容。与其让 ChatGPT 帮你在文件里面瞎猜乱试然后需要你参与进来不断纠错还不如一上来你就把真正需要查找的内容以样例方式精确清楚传递给ChatGPT。而且是越清楚越好。 下面我就来给你演示怎么把内容样例的精确定位获取到并且传递给 Advanced Data Analysis 。 你看这是我下载的活动日程通知主页面的例子。 你可以在浏览器里面 Inspect 检视页面的源码。 这里你可以通过区域选择按钮让浏览器帮忙定位到选定区域对应的源代码位置。 操作效果就像这样 然后你就可以用这种方式拷贝具体文本段落的 xpath 。 我分别拷贝了某个活动对应的时间、地点、URL 等信息。然后连同这个 HTML 文件一股脑扔给了 Advanced Data Analysis。
http://www.hkea.cn/news/14428141/

相关文章:

  • 站长平台官网如何让百度口碑收录自己的网站
  • 淄博市住房和城乡建设厅网站python 快速搭建网站
  • 南阳市城乡和住房建设局网站网站项目评价
  • 杭州电商网站策划设计广东省建设工程安全协会网站
  • 宜昌市住房和城乡建设厅官方网站网站开发的源码
  • 昆明网站建设加q.479185700酒店加盟什么网站建设
  • 牡丹江建设局网站淄博 做网站
  • 农机局网站建设方案app与网站用的服务器
  • 做网站花的钱和优化网站有关系吗广州seo推广运营专员
  • 建设网站人员名单网站开发的推荐
  • 拐角型布局网站做英雄联盟网站的图片素材
  • 无锡网站网页设计培训wordpress股票api
  • 局域网建设网站昆明酒店网站建设
  • 顺德龙江网站建设网站开发公司选择
  • 惠州模板网站哪些网站是用iframe
  • 在哪请人做网站义乌哪里有学做网站的
  • 国内优秀网站设计欣赏关键词指数批量查询
  • 广州网站设计教程来钱快app
  • 网站备案授权书填写模板宁波如何做seo排名优化
  • 手机微信网站怎么做的好wordpress不能重置密码
  • c++能不能作为网页开发语言贵州seo技术培训
  • 广西建设监理协会官网站网站建设需要学什么语言
  • drupal 网站实例宜昌网站推广优化技巧
  • jsp做的网站运行都需要什么福田做网站怎么样
  • 网站制作营销型网络营销策划方案3000字
  • lamp做网站的论文自己做网站的网址
  • 泰兴市网站建设为什么要懂seo
  • 网站源码论坛军事网站 模板
  • 高校专业建设主要内容十堰网站优化排名
  • 百度收录网站但首页快照不更新网站后台 源码