2.2.2 检索和排名
对于大部分搜索者来说,对答案的追求从图2-11中所示的搜索开始。
查询的下一步发生在搜索引擎返回Web上的相关网页列表时,这一列表按照搜索引擎所认为的用户满意度排序。这一过程要求搜索引擎在它所搜集的几千亿个文档寻找,并进行两项工作:第一,仅返回与搜索者的查询相关的结果,第二,按照重要性(考虑网站相关的可信度和权威性)排序结果。相关性和重要性都是SEO过程所要影响的因素。
相关性(relevance)是搜索返回文档的内容与用户查询的意图和关键字相匹配的程度。如果页面包含与用户查询相关的关键字,或者指向页面的链接来自相关页面且使用相关的锚文本,文档的相关性也就随之提高。
你可以将相关性看做"游戏"中的第一步。如果网站与查询不相关,搜索引擎就不会在该查询的搜索结果中包含它。2.3节将更详细地讨论如何确定相关性。
重要性(importance)指的是相对重要性,通过对匹配用户查询的指定文档的引用(citation,常见于学术和商业文件中一篇文章对另一篇文章的参考)次数来度量。每当被其他文档引用时,参考文档的重要性就会提高。在当今的在线环境中,引用可以以文档的链接或者社交媒体网站上的引用等形式发生。确定这些信号权重的方法称为引用分析(citation analysis)。
你可以将重要性看做确定一组同等相关的页面出现在搜索结果中顺序的一种手段。网站的相对权威性以及搜索引擎对该网站的信任度是重要的决定因素。当然,影响排名的因素绝非仅此而已,所有页面的相关性也不可能都一样。最终,相关性和重要性综合确定排名顺序。
因此,当你看到图2-12所示的搜索结果页面时,就能推测对于"marvel superhero stamps"(神奇超级英雄图章)的搜索,搜索引擎(在这个例子中,是必应)认为ebay.com上的神奇超级英雄图章相关网页(http://shop.ebay.com/i.html?_nkw=superhero+stamps)有最高的相关性和重要性综合得分。
重要性和相关性不是人工确定的(即使地球上所有人都参与也无法应付),而是由搜索引擎精心设计出来的数学公式(算法)从大量页面中进行筛选,然后按照质量排名的。这些算法通常由数百个因素组成,在搜索营销领域,通常称这些因素为排名因素(ranking factor)或者算法排名条件(algorithmic ranking criteria)。2.4节将更详细地讨论排名因素(或者Google所称的"信号")。