第2章 搜索引擎基础
本章将开始研究搜索引擎的工作原理。这一主题的坚实基础对于理解SEO这一行业是必不可少的。
第1章已经讨论过,人们习惯于在提交搜索查询之后立即得到搜索引擎的回答。第1章还讨论了查询的数量(每秒超过6 000次),Google早在2008年就曾经宣布,他们知道Web上1万亿个页面的情况(http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html)。由于Web的快速成长,现在这个数字可能又增加了一个甚至多个数量级。
在如此庞大的数据处理任务背后是任务本身的复杂性。理解搜索引擎最重要的一点是,理解用于访问Web上所有网页的爬行器(也称"蜘蛛")是一个软件程序。软件程序的智能受限于所使用的算法,尽管在这些算法中越来越多地使用了人工智能,Web爬行程序仍然没有人类所具备的自适应智能。
软件程序无法像人类那样正确地解读各种类型的数据--例如,在某种程度上,人眼对于视频和图片的辨别能力要胜过搜索引擎爬行器。这还不是爬行器的唯一局限,本章还将更详细地探索它们的某些不足。
当然,局面正在不断变化。搜索引擎持续地增加投资,以改进处理网页内容的能力。例如,图片和视频搜索的进步使得搜索引擎已经接近于人类的理解,2.6节将进一步讨论这个话题。
2.1 理解搜索引擎结果
在搜索营销领域,搜索引擎返回的满足查询要求的网页称作搜索引擎结果页(Search Engine Result Page, SERP)。每个搜索引擎返回结果的格式略有不同,并且包含垂直搜索结果(针对查询中某些触发器的特定内容,稍后将讲解)。