电脑技术学习

Google网页快照中的日期

dn001

虽然我们可以在服务器日志中看到Googlebot的活动记录,了解Google的robot对整个网站的喜好程度,但对于网站内的某个特定网页而言,想要查出Googlebot最新一次造访的时间则没有什么好办法,尤其对访问量较大的网站而言,几乎是不可能的。不过,今后有了个简单的办法,那便是通过查看Google“网页快照”的日期。

之前,Google网站快照(可通过“cache:”命令或搜索结果页面中的“网页快照”链接)的日期,所反应的只是Google最后一次更新索引数据库中特定网页记录的日期,即Google “DownLoad”特定网页内容的日期,换言之,对Google更新记录后从未改动过的网页而言,就算Googlebot再次访问,但由于其首先执行If-Modified-Since(网页内容是否改动)查询,当它得到304 (未更改) 回应时不会下载相应页面内容――这可以最大限度地节省服务器带宽――因此,便会出现网页快照的日期非常“古老”的情况,就象在那之后Googlebot从未访问过该网页一样。

最近,Google Webmaster Central BlogBetter details about when Googlebot last visited a page中宣布,今后网页快照的日期将使用Googlebot最后一次访问的时间,这样,对那些希望了解网站的更新情况多久能在Google中反映出来的朋友们来说将非常有用。

当然,目前仍有相当部分网页快照的时间没有更新,这是一个大工程,需要随着Googlebot对相应网页的访问逐步完成。