清河企业做网站,网站管理过程,同步修改 wordpress,黄石市新闻以大语言模型为代表的AI 技术迅速发展#xff0c;将会影响原有信息网络的方式。其中一个明显的趋势是通过chatGPT 对话代替搜索引擎和浏览器来获取信息。 互联网时代#xff0c;主要是通过网站#xff08;website#xff09;提供信息。网站主要为人类阅读的方式构建的。主要… 以大语言模型为代表的AI 技术迅速发展将会影响原有信息网络的方式。其中一个明显的趋势是通过chatGPT 对话代替搜索引擎和浏览器来获取信息。 互联网时代主要是通过网站website提供信息。网站主要为人类阅读的方式构建的。主要技术基于HTML5/javascript 技术支撑。进入AI 时代网站信息从人类浏览转型AI 机器人搜索和获取。这种变化将引发重大的影响。诸如网络广告文章的版权网页的爬取等等。 本博文探讨一下AI 时代的网站发展趋势。
传统网站对大语言模型并不友好
不利于机器获取信息 浏览网站的主要方式是导航方式人们根据导航指引获取信息。这种方式适合人类的阅读习惯但是并不适合机器获取信息。目前使用一些”网络爬虫“技术来获取网站信息。 网站普遍采取前后端架构前端网页通过web API 读取后端网页和数据库中的数据。webAPI 采用了RestFul方式。无论是调用方式还是数据结构都是自定义的没有统一的标准。 另一方面网站信息是以HTML5 的形式表达甚至是前端程序生成的。它是以人类阅读体验为中心设计的对机器阅读并不友好比如各种”网络爬虫“ 技术都不能完整地读取网站上的信息。网络搜索引擎页难以精准地搜索需要的信息。人们在浏览器面前浪费了大量的时间。特别是中文网站普遍信息质量低下广告漫天飞。检索信息犹如大海捞针。小公司的网站几乎无人问津。
不利于LLM访问 未来的发展趋势是使用大语言模型的对话获取网站信息目前的方式是通过搜索引擎寻找相关的网页内容通过所谓的RAG技术读取关注的信息RAG需要embedding矢量数据库技术的支持。这就要求网站的信息有利于RAG。比如在数据库中除了关键字以外要添加必要的描述description。有助于生成更加有效的矢量数据。 在网站上添加chatGPT 接口也具有不同的方式
浏览器网页与chatGPT 是完全独立的接口借助于chatGPT 实现网页导航的方式
网站的信息开放与内容保护 网络上的网站可以分成两类一种是尽量能够提供所有信息的网站比如企业网站购物网站。另一种是内容保护的网站他们不希望其他人爬取所有的信息比如科研论文发布新闻网银行信息有偿服务网站等等。 对于第一种网站而言未来应该提供机器读取信息的接口和大语言模型的接口为”网络爬虫“提供服务让网站的内容尽量地发布出去。
由此看来未来网站将会有三种基本的访问方式
浏览器阅读大语言模型对话网络爬虫和搜索
这三种访问方式如下图所示 网络爬虫、搜索引擎友好的网站 有意思的是上面提到的第三种方式。借助大语言模型能够实现网站对网络爬虫和搜索引擎友好。使用自然语言的成为网站的统一的接口避免了访问内部的web API 。同时能够实现更加精准的网络搜索。
网站将成为“超级推销员” chatGPT 支持的网站将成为你公司的“超级推销员”和“导购”员。它能够回答客户关心的问题。甚至可以播放视频PPT。回答专业的技术问题。
网页设计的变化 相信未来的网页设计也将发生变化一方面网页中应该添加chatGPT 对话的栏目另一方面如果使用chatGPT 完成网页内容的导航那么网页的前端设计将大幅度简化网页将是单页的方式显示内容去掉了大量的导航内容。网页的内容与chatGPT 对话同步显示网页的UX 设计风格也将发生变化。
思考比行动更重要 chatGPT 带来的AI革命正在到来人们为之兴奋不已。像谷歌百度等依靠搜索引擎赚钱的公司受到的巨大的压力。靠弹广告为生的浏览器公司感到商业模型即将失灵了。AI 时代一切皆有可能。目前几乎大家都在急切地寻找落地的场景。笔者看来急于应用之前深入地思考比仓促上阵更重要。 相信好事情即将发生。。。。。