电脑技术学习

从Google 的目录中删除网页记录

dn001

Google 永远将品质放在第一位。因此,只有当网主提出取消网页记录的请求时,Google 才会删除这些网页的记录,以避免误删网页,保证搜索质量。

以下是各种不同的删除方式,通常需要六到八周的时间,即等到下一次 Google 漫游后才会生效。[admin5.com/google注:googlebot的漫游时间一般都不到六到八周,但其漫游后,robots.txt指定的文件,却不定一生效,基本要等到google dance后才能生效]

更改网址:

由于 Google 漫游器依网址来辨别网页,所以您不能自己更改目录里的网址。Google 下次漫游时都会自动更新这些网址。漫游器的行程是自动设定的,我们也没有办法让它提前到达您的网站。

如果您在 Google 漫游后更改了网址,您可以填写网页登录申请表,并按照下列说明删除旧网址。但还是要提醒您,登录的新网址不会马上生效,所以在 Google 下次漫游前的那段时间里,可能无法通过 Google 访问您的网站。

我们建议您要求各网站更新当前指向您的旧网站的链接,使其指向您的新网站,而不要申请更改网址。另外,请不要忘记更改您在 Yahoo! 目录和其它网页目录中的记录。最后,如果您的旧网址使用 HTTP 301(永久)重定向指向您的新网站,Google 漫游时会自动获知新网址,并在六到八周内自动进行更新。

删除整个网站

要从 Google 目录中删除整个网站或部份网页的记录,可以在您服务器的根目录中放置一个 robots.txt 文件。

如果您不希望 Google 漫游器或其它搜索引擎进入您的网站,请在服务器的根目录中放入一个 robots.txt 文件,其内容如下:

User-Agent: *
Disallow: /

这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html

删除个别网页:

如果只需要保护个别网页,可在那一页加入以下 HTML 代码:

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:

<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">

有关这个标准 meta 标签的详细信息,请访问:http://www.robotstxt.org/wc/exclusion.html#meta

删除网页摘要:

网页摘要是结果页上的文字摘要,其中所有关键词均以粗体显示。选择网页之前,可以通过这些摘要浏览一下搜索词在网页中的上下文。大部份人都会先选择有合适网页摘要的网页。

如果您不希望 Google 提供您网页的摘要,请在网页中加入以下代码:

<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">

请注意:删除网页摘要的同时也会删除网页快照。

删除网页快照:

Google 在网络上漫游时会保存大量文档中的文字。如果因保存网页的网络服务器出现临时故障而无法访问原始网页,最终用户还可以查看这些网页“快照”。这些网页快照是 Google 上次漫游时网页的内容。当您查看网页快照时,其顶部标题将提醒您这是快照,而不是实际网页。

如果您不希望任何漫游器保存您网页的快照,请将 meta 标签 NOARCHIVE 放入网页 HTML 代码的 <HEAD> 部份,如下所示:

<META NAME="ROBOTS" CONTENT="NOARCHIVE">

如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:

<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">

请注意:此标签只删除“网页快照”链接,Google 仍会记录该网页,并显示网页摘要。

删除失效链接

Google 会定期自动更新整个网页目录。在网上漫游时,Google 会自动查找新的网页,删除失效的链接,并更新旧的链接。对于已经过时的链接,Google 极有可能在下次漫游时将其删除。

删除 Google 图像目录中的图像

我们不会随便删除 Google 图像目录中的图片,除非网主亲自要求我们这样做。您可以请网站管理员在服务器的根目录中放入一个 robots.txt 文件。(如果不行,可以将其放到您的目录中。)

示例:如果您的网站上有 www.yoursite.com/images/dogs.jpg,但您不希望 Google 收录 dogs.jpg 这张图片,您可以增加 www.yoursite.com/robots.txt 文件,其内容如下:

User-Agent: Googlebot-Image
Disallow: /images/dogs.jpg

如果要删除网站里所有图片的记录,请将包含以下内容的 robots.txt 文件放入服务器根目录:

User-Agent: *
Disallow: /

这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html

请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序您的网站管理员必须先创建一个 robots.txt 文件并将其放在您的网站中,这个自动程序才能工作。

只要您网络服务器的根目录中有这个 robots.txt 文件,Google 漫游器就不会进入您的网站。如果您无权访问服务器的根目录,也可以将 robots.txt 文件放在要拒绝漫游器进入的目录中。如果这样做或使用自动删除程序,Google 会暂时(90 天)从 Google目录中删除您的网站记录。(如果 robots.txt 文件不在根目录中,需要每隔 90 天再通过网址删除程序登记一次。)