搜索引擎的发展历史

2023-11-15

第一代搜索引擎:分类目录时代

分类目录时代的的搜索引擎会收集互联网上各个网站的站名、网址、内容提要等信息,并将它们分门别类的编排到一个网站中,用户可以在分类目录中逐级浏览并寻找相关的网站。搜狐目录、hao123等就是典型的分类目录时代的代表。

hao123目录网站首页

第二代搜索引擎:文本检索时代

在文本检索时代,搜索引擎可以对用户输入的查询信息进行各种运算,进而判断其与目标网页内容相关程度的高低,并返回相关度高的网页给用户。一些早期的搜索引擎,如AltaVista、Excite等都是这个时代的代表。

Excite搜索首页

第三代搜索引擎:整合分析时代

到了整合分析时代,搜索引擎会通过外部链接的数量来判断一个网站的流行性和重要性,然后再结合网页内容的重要性和相似程度来完善反馈信息的质量,最后还会降反馈回来的海量信息,智能整合成一个门户网站形式的界面,而不是像文本检索时代返回一个没有分类的链接清单。最早使用这种整合分析的是Google,它不仅使Google大获成功,还在当时引起了学术界和其他商业搜索引擎的极度关注。

Google搜索首页

第四代搜索引擎:用户中心时代

以用户为中心就是当用户查询时,需要充分挖掘用户的深层次需求,实现精准化的用户定位和营销,例如,当搜索关键词"手机"时,对于不同职业和不同年龄段的用户来说,他们的需求是不同的。甚至同一个用户,也会因为时间和场合的不同而有不同的需求。而要通过用户输入的简短关键词来判断用户的真正需求,就需要搜索引擎能够真正了解用户。搜索引擎可以通过用户搜索时的大量特征,如上网的时间、操作习惯、搜索内容等,去逐渐勾勒用户的大致特征,如性别、年龄阶段、兴趣爱好等,这是数据就是搜索引擎进行"商业数据挖掘"的巨大宝藏。

百度搜索首页

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

搜索引擎的发展历史 的相关文章

  • 包含 对于带有 hashbang 的页面有害吗?

    谷歌关于这个元标签的说法是 以下重要限制适用 元标记只能出现在没有哈希片段的页面中 仅有的 可能会出现在内容字段中 元标记必须出现在文档的头部 Source https developers google com webmasters aj
  • Safari 添加尾部斜杠

    我有一个 ASP NET 网站 它使用 URLRewrite 2 删除 URL 中的尾部斜杠 我们注意到 Mac 上的 Safari 不遵守此规则 它始终在 URL 中留下尾部斜杠 SEO Moz 显示两个 URL 这似乎是潜在的重复内容问
  • =importXML() 中的 xpath 用于提取元描述

    我正在尝试使用 Xpath 使用 Google Sheets 从网页中提取元描述 我正在努力提取标题 importXml www example com title 以下是我的两个学习来源 http seogadget co uk play
  • 谷歌索引页面加载后通过ajax或javascript检索的文本

    几个谷歌问题 1 谷歌是否有机会 看到 使用ajax检索的文本 用户从一系列选择框中进行选择 然后显示数据库中的一些文本 2 如果我使用javascript更改页面标题 在HEAD区域之外 谷歌会索引修改后的标题吗 抱歉 如果这些是琐事问题
  • 对重复内容不显示是否会影响 SEO/语义?

    重复内容上的 Display none 是否会影响 SEO 语义 假设您正在构建一个移动优先的响应式网站 在较小的断点处 您选择显示页面的标题标语 h1 在主要英雄横幅中 但是 稍后您希望在同一位置显示公司徽标 并在子横幅中显示您的口号 例
  • 如何在 Angular 2 中实现 SEO(元标签)(Angular 通用用于服务器端渲染)?

    我正在搜索一个关于 Angular 2 的 SEO 或元标签的完整工作示例 使用 Angular 通用在服务器端渲染 被 facebook twiter 和其他元标签识别 但我没有成功 我找到了多篇文章 但有不完整的 没有所有源代码可用 或
  • SEO 的查询字符串参数名称

    如果我有一个像这样的网站 google com index html c 123123 p shoes 对于 SEO 来说 将其设置为 google com index html code 123123 footwear shoes 我的意
  • 限制 Wordpress 中现有和新的永久链接 slugs 的大小以进行 SEO

    我在 Google 上读到一篇文章 其中提到为了良好的 SEO 最好将 URL 中的 slug 大小限制为 5 个单词 当我使用 WordPress 时 链接会自动分配给文章标题 要仅用 5 个字重做所有链接 我必须花费数月时间来编辑博客上
  • 如何使用规范链接删除重复的标题标签和元描述标签

    我为我的网站运行了 SEO 工具 它显示我有重复的标题标签和元描述标签 两者都在 domain com 和 index html 中 它们是同一个文件 如何使用 Canonical Link 删除重复标签 请帮忙 谢谢 您遇到了一个典型的重
  • 重写 php 应用程序以获得 seo 友好的 url

    我有 php 应用程序 由于客户要求拥有 SEO 友好的 url 因此必须部分重写 我的链接如下 www mysite com articles en php artid 89 我必须更改其中的网址 www mysite com artic
  • 从 OpenCart 中删除 index.php?route=

    我是一名 NET 开发人员 但我的朋友打电话给我寻求支持 我对 htaccess 做了一些更改 但我的 SEO 被破坏了 一切都以 url 上的 www 标记开始 我发现当我们不使用 www 并且我更改了 htaccess 时 我们会遇到一
  • 现在采用 HTML 5 进行网站重新设计有何优点和缺点?

    我正在对一个大型网站进行重新编写和重新设计 我一直在阅读 HTML 5 并想在采用该设计实现之前了解它的缺点 该设计需要在 A 级浏览器中工作 是的 包括 IE6 所以我想知道如何
  • 我网站的 CSS 何时会影响我的搜索引擎排名?

    起初我认为 css 绝对没有什么用处 只是当用户在浏览器中查看文档时设计文档样式 但后来我意识到搜索引擎也在索引页面中使用CSS 搜索引擎不会将内容编入索引display hidden我相信 并且严厉惩罚使用关键字堆叠的网站 用户从未见过的
  • 什么是“友好 URL”? [关闭]

    Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案 我最近 在本网站和其他地方 阅读了大量有关 友好 URL 的讨论 但我不确定究竟是什么使 URL 变得 友好 以及为什么我们真正关心
  • 在 JSON-LD 中创建产品数组

    有人能发现我下面的代码有什么问题吗 它不会在 Google 结构化测试工具中进行验证 我正在尝试创建 JSON LD 代码以添加到具有多种待售产品的页面
  • Rails 中的漂亮路径

    我有一个类别模型 我使用默认的脚手架来路由它resources categories 我想知道是否有办法改变路径 category id to category name 我补充道 match categories name gt cate
  • PageSpeed Insights 没有看到 Gzip 压缩

    我正在努力加快我的网站速度 谷歌洞察 https developers google com speed pagespeed insights https developers google com speed pagespeed insi
  • 如何使用 WP REST API 插件获取 YOAST SEO 插件数据?特别是 wpseo_head 挂钩内容

    我正在使用 WP REST API 来获取所有发布数据 嗯 它工作得很好 但任何网站最关心的是 SEO 部分 我正在使用 YOAST SEO 插件 我想获取它在 HTML 的 Head 部分中创建的所有元标记 仅供参考 我使用 Wordpr
  • 如何在 Rails 应用程序中删除 URL 的尾部斜杠? (在 SEO 视图中)

    为了避免内容重复 我希望避免通过多个 URL 带或不带尾部斜杠 访问我的网站页面 目前 URL catalog product 1 and catalog product 1 导致同一页面 我的目标是将第二个 URL 重定向到第一个 当然是
  • 从搜索引擎结果中删除页面

    大家好 我对 SEO 有点陌生 我建立了一个单页网站 最初使用了多个页面 但现在已删除 看起来谷歌已经对这些页面建立了索引 以便它们显示为搜索结果 有什么办法可以从搜索结果中删除这些内容吗 谢谢 描述如何从结果中删除您的网站

随机推荐

  • ethercard php_PHP如何通过编程在服务端验证以太坊签名

    以太坊有一个非常强大的JavaScript生态系统 有一些很棒的开源项目 比如ethereumjs util 它提供了一个用以太坊帐户签名的即插即用功能 JavaScript的一个缺点是 在许多领域 它带来了安全问题 一个这样的安全风险是显
  • Java多线程:解决高并发环境下数据插入重复问题

    1 背景描述 应用框架 Spring SpringMVC Hibernate 数据库 Oracle11g 一家文学网站向我系统推多线程低并发推送数据 我这边观察日志和数据库 发现有一个作者被存储了2次到数据库中 按照程序的编写逻辑 重复的数
  • CCF C³-24@中电金信:超级算力时代的新格局

    C 活动第24期主题 超级算力时代的新格局 将于2023年9月21日周四 16 30 19 30 在上海举行 报名从速 在深度数字化转型时代 随着算力需求增长和算力供给创新的双重叠加 简单算力供给正在演化为多元化算力供给 单体架构正在向云原
  • html在网页上显示不出,WKWebView 加载本地HTML显示不出网页问题,这点你注意了吗?-------完美显示...

    1 首先 WKWebView的引入和创建 我这里就不做阐述 我要说的 就是解决别人不能给您解决的问题 2 WKWebView 加载本地HTML 也就是两三句代码 是吧 作为读者的您肯定也知道 也实现了 就是如下代码 这里要说一下 为了做到正
  • Windows安装mysql服务

    Windows上同时安装两个mysql服务 一 下载两个版本的MySQL 进入官网下载 https www mysql com 二 将下载下来的压缩包放到合适的位置并且解压缩 2 1配置环境变量 2 2创建my ini文件 mysql 设置
  • AWS SAA-C03 #36

    A company is building an application in the AWS Cloud The application will store data in Amazon S3 buckets in two AWS Re
  • 前端第三方组件库官网

    前端第三方组件库官网 Vant Weapp 官网 https vant contrib gitee io vant weapp home Vant ui 官网 https vant contrib gitee io vant zh CN r
  • 面试官问你为什么离开上一家公司该怎么回答?

    相关文章 程序员面试必问 你为什么要离开上一家公司 你会怎么回答 面试官问你为什么离开上一家公司该怎么回答 是否被HR问过 你为什么离开上一家公司 总结 没有晋升空间 想找一个更大的舞台 上家公司的工作量不饱和 团队气氛不足 我是一个习惯加
  • 在VS2010进行MFC编程设置字符集的问题(使用多字节字符集引起错误)

    1 error C2664 WideCharToMultiByte 不能将参数 3 从 CString 转换为 LPC WSTR 参数3是m edit 2 error C2039 GetWindowTextW 不是 CComboBox 的成
  • moviepy音视频开发:音频剪辑基类AudioClip

    前往老猿Python博文目录 一 背景知识介绍 1 1 声音三要素 音调 人耳对声音高低的感觉称为音调 也叫音频 音调主要与声波的频率有关 声波的频率高 则音调也高 音量 也就是响度 人耳对声音强弱的主观感觉称为响度 响度和声波振动的幅度有
  • 时间序列分析和预测(含实例及代码)

    导论 研究时间序列主要目的 进行预测 根据已有的时间序列数据预测未来的变化 时间序列预测关键 确定已有的时间序列的变化模式 并假定这种模式会延续到未来 时间序列预测法的基本特点 假设事物发展趋势会延伸到未来 预测所依据的数据具有不规则性 不
  • C#窗体调用地图(高德地图)-实现公交线路查询

    C 窗体调用地图 高德地图 实现公交线路查询 新建C 工程 创建Windows窗体应用程序 添加WebBrowser控件 用来显示网地图页 可以把滚动条 ScrollBarsEnabled 设置成false给取消掉 更加的美观方便 使用高德
  • 刷脸支付成为下一个主流我们拭目以待

    智能刷脸支付已成为2019支付生态的风口 对于超市 便利店 企事业单位 停车场 餐厅等所有支付场景 越早加入刷脸支付 将享受越多的风口红利 刷脸支付 智慧医疗 智慧校园 智慧银行 餐饮超市酒店 无感停车场 各场景解决方案 软件定制开发 支付
  • 谷歌面试题解析: 扔鸡蛋的正确方式是什么?

    面试中 为了考察应聘者的思维方式 面试官偶尔会出一些谜题 Puzzles 比如 在谷歌 就有这样一道让人 闻风丧胆 的面试题 You work in a 100 floor building and you get 2 identical
  • 个人网站搭建记录

    个人网站地址 实际需要 云服务器 域名 网站备案 知识储备 node写一些后台接口 express mysql数据库 navicat连接数据库 mysql 常用终端命令行 https www jb51 net article 194140
  • hexo问题及解决

    1 推荐主题 butterfly 的默认 layout 很好 尤其对于内容比较多的 blog 安装方法如下 npm install hexo renderer pug hexo renderer stylus save npm instal
  • QMessageBox、QColorDialog、按钮汉化显示

    QMessageBox QColorDialog 按钮汉化显示 版本 Qt5 9 9 环境 QtCretator MinGW 在Qt源码目录下找到qt zh CN ts复制一份到工程目录 该文件在 G install Qt Qt5 9 9
  • 图像仿射变换shear怎么翻译?剪切、错切、推移哪个译词好?

    老猿Python博文目录 https blog csdn net LaoYuanPython 仿射变换博文传送门 带星号的为付费专栏文章 图像仿射变换原理1 齐次坐标来龙去脉详解 图像仿射变换原理2 矩阵变换 线性变换和图像线性变换矩阵 图
  • 关于CASE WHEN造成的查询缓慢的生产问题思考

    因为做的是类似SAAS的系统 关于同一个业务没会有不同的视角 有管理员 有类别分类的 有特别逻辑处理的 总而言之涉及到很多方面 再加上历史遗留问题导致导致的数据问题 这SQL写起来真的酸爽 除了简单的关联 还要考虑到一个效率问题 最近就因为
  • 搜索引擎的发展历史

    第一代搜索引擎 分类目录时代 分类目录时代的的搜索引擎会收集互联网上各个网站的站名 网址 内容提要等信息 并将它们分门别类的编排到一个网站中 用户可以在分类目录中逐级浏览并寻找相关的网站 搜狐目录 hao123等就是典型的分类目录时代的代表