第一代搜索引擎:分类目录时代
分类目录时代的的搜索引擎会收集互联网上各个网站的站名、网址、内容提要等信息,并将它们分门别类的编排到一个网站中,用户可以在分类目录中逐级浏览并寻找相关的网站。搜狐目录、hao123等就是典型的分类目录时代的代表。
第二代搜索引擎:文本检索时代
在文本检索时代,搜索引擎可以对用户输入的查询信息进行各种运算,进而判断其与目标网页内容相关程度的高低,并返回相关度高的网页给用户。一些早期的搜索引擎,如AltaVista、Excite等都是这个时代的代表。
第三代搜索引擎:整合分析时代
到了整合分析时代,搜索引擎会通过外部链接的数量来判断一个网站的流行性和重要性,然后再结合网页内容的重要性和相似程度来完善反馈信息的质量,最后还会降反馈回来的海量信息,智能整合成一个门户网站形式的界面,而不是像文本检索时代返回一个没有分类的链接清单。最早使用这种整合分析的是Google,它不仅使Google大获成功,还在当时引起了学术界和其他商业搜索引擎的极度关注。
第四代搜索引擎:用户中心时代
以用户为中心就是当用户查询时,需要充分挖掘用户的深层次需求,实现精准化的用户定位和营销,例如,当搜索关键词"手机"时,对于不同职业和不同年龄段的用户来说,他们的需求是不同的。甚至同一个用户,也会因为时间和场合的不同而有不同的需求。而要通过用户输入的简短关键词来判断用户的真正需求,就需要搜索引擎能够真正了解用户。搜索引擎可以通过用户搜索时的大量特征,如上网的时间、操作习惯、搜索内容等,去逐渐勾勒用户的大致特征,如性别、年龄阶段、兴趣爱好等,这是数据就是搜索引擎进行"商业数据挖掘"的巨大宝藏。