2.3.2 度量内容质量和用户参与度
搜索引擎也试图度量网站内容的质量和独特性。它们可能使用的方法之一是评估文档本身。例如,如果网页有许多拼写和语法错误,就说明对于页面投入的编辑精力不够(你可以在http://searchengineland.com/google-pagerank-spelling-correlation-95821上看到这方面的更多内容)。
搜索引擎也能分析文档的阅读水平(reading level)。流行的公式之一是Flesch-Kincaid分级可读性公式(Flesch-Kincaid Grade Level Readability Formula),该公式考虑平均单词长度和句子中的单词数量,确定理解句子所需要的教育水平。想象一个场景:网页上销售的产品是儿童玩具,而计算出来的阅读水平说明,具备高等院校水平的人才能阅读该页面。这也是拙劣的编辑工作的另一个表现。
搜索引擎用于评估网页质量的其他方法是度量实际的用户交互。例如,如果访问网页的大量用户在点击搜索结果之后立即返回搜索引擎,并且点击下一个结果,这就是代表网页质量不佳的一个强有力指标。
网站的参与度在2011年2月23日Google发行熊猫更新(Panda Update)时开始成为排名因素(http://searchengineland.com/google-forecloses-on-content-farms-with-farmer-algorithm-update-66071)。Google已经访问了大量可用于度量访问者与网站交互情况的数据源。这些数据源包括以下几种。
与网页搜索结果的交互
例如,如果一个用户点击SERP列表到达你的网站,点击"后退"按钮,然后点击同一组搜索结果中的另一个结果,那可以看做是一个负面的排名信号。相反,如果SERP中排名在你的网站之下的结果点击次数超过你,那也可以看做你的网站的负面排名信号和那些网站的正面排名信号。搜索引擎是否使用这些信号以及这些信号的权重尚不得而知。
Google Analytics
很难知道有多少网站运行Google Analytics. immeria.net于2008年进行的网站调查显示,Google Analytics具有59%的市场份额(http://blog.immeria.net/2008/01/web-analytics-vendors-market-shares.html)。而Metric Mail Blog检查了Alexa中的前100万个网站,发现其中大约50%使用了Google Analytics (http://metricmail.tumblr.com/post/904126172/google-analytics-market-share)。简言之,Google能够收集世界上一大半网站的详细数据。
Google Analytics能够向Google提供丰富的网站数据,包括:
跳出率(bounce rate)
仅访问网站上一个页面的访问者比例。
网站停留时间
用户在网站上花费的平均时间。注意,Google Analytics只在每个页面加载时接收信息,所以如果访问者只查看一个页面,它无法知道在该页面上花费的时间。更精确地说,这一衡量指标告诉你在加载第一个页面和加载最后一个页面之间的平均时间,但是不考虑访问者在最后一个页面上花费的时间。
每个访问者查看的页面数
网站的每个访问者所查看页面数的平均值。
Google 工具栏
不知道有多少用户使用Google工具栏,但是本书作者相信,这个数字肯定多达数百万。Google能够跟踪这些用户的整个上网行为。和Google Analytics不同,Google工具栏能够度量从用户初次访问某个网站到用户从不同网站加载页面之间的时间,也能计算跳出率和每个访问者查看的页面数。
Google +1按钮
2011年4月,Google开始公测一项新功能--+1按钮(http://www.google.com/+1/button/)。用户可以利用这项功能,在搜索结果中直接(或者在网页上)为网页"投票",从而指明特定搜索查询中他们最喜爱的网站。
Chrome Blocklist扩展
2011年2月,Google发行了Chrome Blocklist扩展(http://googleblog.blogspot.com/2011/02/new-chrome-extension-block-sites-from.html)。该扩展为Chrome浏览器的用户提供了指出他们所喜爱的搜索结果的一种手段。
Google即时预览(Google Instant Preview)
Google在其搜索结果中还提供了即时预览功能(http://www.google.com/landing/instantpreviews/#a)。用户在确定所点击的搜索结果之前能够看到网页的略图。如果用户查看页面预览之后决定不点击它,效果就与负面的投票相同。
Google阅读器
Google提供了世界最流行的RSS源阅读器,该阅读器能够提供许多最吸引人的数据。
Goo.gl
2010年9月,Google发行了自己的URL缩短服务。这一工具使Google即使在Google Web爬行器无法前往的封闭环境中,也能看到共享和点击的内容。
最重要的因素可能是你的网站与竞争者的差别。如果你的网站有较好的参与度,这一指标很可能被看做高质量的象征,从而可能大大提升你的排名。搜索引擎对这类信号的使用方法很少公开,所以上述观点只是本书作者对Google在这一领域所作所为的推测。Google对这一主题最有趣的帖子之一可以在http://googlewebmastercentral.blogspot.com/2011/05/more-guidance-on-building-high-quality.html上找到。社会化和用户参与度排名因素在第8章中将更详细地加以讨论。