2.2.3 评估网页内容
搜索引擎为每个网页上的内容赋予很高的权重。毕竟,一个页面是关于什么的是由其内容决定的,为了做出这一决定,搜索引擎对爬行中找到的每个页面进行细致的分析。
你可以这样认为:搜索引擎对出现在网页上的所有单词和短语做出细致的分析,然后构建一张数据地图,用于在用户输入相关搜索查询时确定是否在结果中显示该页。这张地图通常称为语义地图(semantic map),能够帮助搜索引擎理解页面与用户搜索查询之间的匹配度。
如果页面内容与查询在语言上不匹配,页面出现在结果页面上的可能性就要低得多。因此,你在页面上放置的单词和页面的"主题"在排名中有巨大的作用。
图2-13展示了搜索引擎分割页面的方式,用的是Stone Temple Consulting网站上的一个页面。
在一个网站上,一个网页的导航元素可能和许多网页的导航元素都很类似。搜索引擎不会忽略这些导航元素,它们也起着重要的作用,但是对搜索引擎确定网页上的独特内容没有帮助。在这方面,搜索引擎关注的是页面的"实际内容"(图2-13中标出的地方)。
确定页面上的独特内容是搜索引擎工作的重要组成部分,对页面独特内容的理解,正是搜索引擎用于确定网页与各类搜索查询是否匹配的因素。由于网站上的许多页面通常都使用相同的导航,因此它对搜索引擎区分相同网站上各个页面的独特内容没有作用。
这并不意味着导航链接不重要,它们无疑是重要的,但是,因为许多网页共享相同的导航链接,在确定网页独特内容的时候它们未予考虑。
搜索引擎所面临的任务之一是判断内容的价值。尽管使用链接分析判断公众对内容的反应是该过程的一部分,但是搜索引擎还可以根据其在网页上看到的内容得出一些结论。
例如,另一个网站上是否有完全相同的内容?搜索引擎所能发现的独特内容是两句话还是长达500多个字?内容是否过度重复相同的关键词?这只是搜索引擎在确定内容价值时所考虑的几个因素。