什么是软 404 以及如何修复它们?

📚 文章大纲

我们一起来了解什么是软 404 错误,并介绍常规(或硬)404 错误之间的区别。然后,我将解释如何查找这些错误并解决它们。

什么是软 404 错误?

软 404 错误,soft 404,是指当用户访问一个网页时,服务器返回的状态码是 200 OK,表示页面成功加载,但实际上页面内容却类似于 404 Not Found 错误页面,即所请求的页面不存在。这种情况通常发生在网站上进行了一些变动,删除了某个页面或者进行了重构,但服务器仍然返回正常的状态码和页面内容,而不是正确的 404 状态码。

软 404 错误可能会对用户体验和搜索引擎优化产生负面影响。搜索引擎可能会将软 404 错误的页面视为有效内容,从而影响网站的排名和索引。此外,对用户来说,他们期望能够得到正确的信息,而不是看到一个误导性的页面。

为了避免软 404 错误,网站管理员应该在删除页面或进行网站重构时,正确地返回 404 状态码,表明页面不存在。这有助于搜索引擎正确处理这些页面,并让用户得到更好的体验。

(硬)404 和软 404 错误有什么区别?

硬 404 错误和软 404 错误之间的区别在于它们向搜索引擎显示的状态。

如果出现硬 404 错误,则会将 404 错误代码返回给页面访问者和搜索引擎。这告诉双方页面不存在。

以下是服装网站 ModCloth 的硬 404 错误示例:

对于软 404 错误,404 错误代码将显示给访问者,但不显示搜索引擎。

相反,他们会看到 200 OK 状态,这给了他们爬行的绿灯。因此,如果您在 Google Search Console 中看到软 404 错误,则意味着您网站上的某些页面可能会返回 404 错误,即使它们确实存在。

下面是关于(硬)404 错误和软 404 错误的区别的表格:

错误类型描述状态码页面内容
硬 404 错误当用户访问不存在的页面时返回的错误类型。404包含标准的 404 错误页面
软 404 错误当用户访问页面时服务器返回状态码为 200 OK,但内容类似于 404 页面,通常由于页面变动或删除。200 OK类似于 404 页面的内容

总的来说,(硬)404 错误是当页面实际上不存在时,服务器正确地返回的状态码和页面内容。而软 404 错误是在服务器返回 200 OK 状态码的情况下,页面内容却类似于 404 页面的情况。避免软 404 错误对于维护良好的用户体验和搜索引擎优化至关重要。

软 404 错误会影响我的网站排名吗?

简短的回答是肯定的。

软 404 错误会影响您的网站在 SERP 上的排名。要了解原因,您需要了解 Google 如何抓取网站。

为了防止网站服务器紧张并减少抓取机器人的工作量,Google 使用一种称为抓取预算的东西来确定抓取网站的数量和频率。抓取预算是指 Googlebot 在每次访问期间抓取您网站上的网页数量。爬网预算由爬网速率和爬网需求组成。

根据谷歌,定义如下:

  • 抓取率是指 Googlebot 在抓取您的网站时每秒向您的网站发出的请求数。
  • 抓取需求是 Google 希望根据受欢迎程度抓取您的网站的程度、抓取后的时间等。

当您的网站上出现大量软 404 错误时,您正在使用大量的抓取预算。这意味着您现有的页面被抓取的次数减少,从而导致 SERP 中的排名越来越少。

可以这样想:如果您的网站有 100 个网页,但 Google 确定您的抓取预算为 70,那么 Google 只会抓取您 70% 的网页。如果 10 个网页是软 404 错误,则其中部分或全部网页可能会落入 70 的抓取预算。因此,您将失去抓取有价值页面的搜索引擎。

软 404 错误可能会影响您的网站排名。搜索引擎在处理网站内容时,会根据返回的状态码和页面内容来判断页面的有效性和质量。如果您的网站频繁出现软 404 错误,搜索引擎可能会错误地认为这些页面是有效的内容,从而影响您的网站在搜索结果中的排名。

搜索引擎的目标是为用户提供最佳的搜索结果,如果搜索引擎认为您的网站存在大量的软 404 错误,它可能会对您的网站信誉和可信度产生负面影响。这可能导致搜索引擎在显示搜索结果时将您的网站排名降低,从而减少流量和访问量。

为了避免软 404 错误对网站排名的影响,建议您在进行网站变动、删除页面或进行重构时,正确地返回 404 状态码,表明页面不存在。这有助于搜索引擎正确处理这些页面,维护良好的用户体验和搜索引擎优化。

软 404 会导致什么问题?

除了在 SERP 中的排名较低外,其他问题与您网站上的软 404 错误有关。

例如,如果 Googlebot 抓取的网页出现软 404 错误,但发现该网页上的内容实际上并未丢失,则可能会认为您的网站提供了虚假的 404 错误。这可能会导致您的网站受到谷歌的处罚。

最大的问题之一是糟糕的用户体验。由于软 404 网址仍显示在搜索结果中,因此用户可能会被定向到不存在的网页。

如果用户点击返回软 404 错误的网页链接,他们可能会认为该网页不存在并离开您的网站。这可能会损害您网站的跳出率,并导致用户在您的网站上花费更少的时间。

也可能对网站的性能和运营产生影响。

虽然 404 错误页面不会像包含内容的页面那样占用那么多的服务器空间,但它们仍然占用带宽。如果Google和其他搜索引擎将流量引导到不存在的页面,您仍然会受到点击,这可能会降低网站的速度和性能。

软 404 错误可能会导致以下问题:

  • 搜索引擎排名下降: 搜索引擎会将软 404 错误的页面视为有效内容,这可能导致搜索引擎错误地将这些页面纳入索引中,影响网站的排名。搜索引擎会更喜欢显示内容丰富和有用的页面,软 404 错误可能使您的网站在搜索结果中的排名降低。
  • 用户体验恶化: 当用户访问一个页面时,他们期望能够获得有用的信息,而不是看到错误页面。软 404 错误会误导用户,使他们认为页面存在,但实际上内容却无法满足他们的期望,从而导致用户体验受损。
  • 减少网站可信度: 频繁的软 404 错误可能会使搜索引擎和用户对您的网站产生负面印象,认为您的网站不够可靠和专业。这可能会影响用户对您网站内容的信任度和愿意与之互动的意愿。
  • 搜索引擎爬虫浪费资源: 当搜索引擎爬虫访问软 404 错误的页面时,它会花费时间和资源,但却无法获取有价值的内容。这可能导致搜索引擎资源浪费,影响其他页面的索引和排名。

为了避免这些问题,您应该确保在页面不存在时返回正确的 404 状态码,告诉搜索引擎和用户页面不存在,同时提供有用的导航或链接,以帮助用户找到相关内容。这有助于维护良好的用户体验,保护网站的可信度,并提升搜索引擎排名。

如何查找(和修复)软 404 错误

由于软 404 错误不是官方状态,因此对网站所有者来说并不那么明显。

这就是像Google Search Console这样的工具的用武之地。根据谷歌的说法,Search Console“帮助你衡量网站的搜索流量和性能,解决问题,并使你的网站在谷歌搜索结果中大放异彩。

Google Search Console 可以帮助您解决的一个问题是软 404 错误。

在谷歌搜索控制台中查找软 404 错误

要使用 Google Search Console,请注册一个帐户并连接您的域。这是一个简单的过程,只需几分钟即可完成。

连接后,Google Search Console有时间收集信息,您会在 Google Search Console 的“覆盖范围”下发现软 404 错误:

它可以通过以下两种方式之一显示:作为错误或作为排除(如上所示)。

在Google搜索控制台中以错误状态显示的软404是您首先要定位的内容。那些处于已排除状态的页面仍应得到解决,但Google已出于某种原因停止抓取这些页面。

如果您在 Google Search Console 中没有看到任何软 404 错误,还可以使用像 Screaming Frog 这样的抓取工具来抓取您的网站并查找返回 404 错误的网页。只需转到“响应代码”选项卡并查找返回 404 错误的任何页面。

如果页面不存在:设置正确的 404 或 410 错误

如果您收到的软 404 错误是真实的,请在服务器上设置正确的 404(未找到)或 410(已删除内容)错误。这可确保网站访问者和爬网机器人看到正确的错误。

在搜索引擎方面,404和410错误代码之间有区别吗?

根据谷歌的约翰·穆勒(John Mueller)的说法,并非如此。这两个错误代码都告诉Google停止将网址编入索引,无论哪种情况,这都是您想要的结果。

下面是它们之间的区别:

  1. 404 错误: 当用户访问一个不存在的页面时,服务器会返回 404 Not Found 错误码。搜索引擎会将这些页面视为临时性不存在,但可能在将来重新出现。因此,搜索引擎会保留这些页面的索引,并继续尝试抓取它们,以便在未来可能找到页面内容。
  2. 410 错误: 当用户访问一个已经被永久性删除的页面时,服务器会返回 410 Gone 错误码。搜索引擎会将这些页面视为永久性不存在,服务器明确表示这些页面不会再回来。因此,搜索引擎会将这些页面从索引中删除,不会继续尝试抓取它们。

因此,如果您确定一个页面已经永久性删除并且不会再恢复,使用 410 错误码可能更适合,因为它会更快地告诉搜索引擎停止尝试抓取这个页面。如果页面只是暂时性不存在,您可以使用 404 错误码。在某些情况下,使用正确的错误码可以帮助优化搜索引擎对您网站的处理和索引。

如果页面确实存在:改进内容并重新索引

谷歌擅长发现软404错误,但它并不完美。它可能会错误地将页面报告为软 404,即使页面上存在内容也是如此。

这通常发生在内容简短或不相关时。

假设该页面是必需的,您需要增加内容以确保它不会被误认为是软 404。这并不意味着使用绒毛或填充物,而是使用相关且引人入胜的内容,以提高您网站的质量。

如果您的网页需要批量处理,请考虑添加图像、图表和图表,以及可以使用外部引用备份的数据驱动内容。这些为您的网站提供了可信度,如果页面返回软 404 错误,这一点尤其重要。查找 404 错误可能对网站的后端和前端以及用户体验都有好处。

如果页面被移动:设置 301 重定向

合并内容页面或移动内容时,请务必尽快设置重定向。否则,您的网站访问者可能会被定向到 404 页面。

如果这导致软 404 错误,那么您会很高兴知道修复很简单。您只需要设置永久 301 重定向到您网站上的较新页面。

大多数 CMS 都有内置的重定向工具。只需输入旧 URL 和新 URL,流量就会自动重定向。本指南将引导您在WordPress上设置重定向。

设置完成后,重定向将传达给搜索引擎爬虫,以便它们抓取正确的页面。

结论

从您的网站中删除页面时,有适当的方法可以向网站访问者和搜索引擎抓取机器人发出删除信号。

最常见的方法是设置 404 错误页面。但是,如果未正确配置,则可能无法将 404 错误传达给爬网机器人。因此,会发生软 404 错误。

虽然软 404 错误可能会导致搜索引擎排名和用户体验出现问题,但它们很容易找到和解决。

根据具体情况,您可以设置永久 404、设置 301 重定向或改进页面内容并重新编制索引。这些修复只需几分钟,但可能会显着影响网站性能。

您上次检查软 404 错误是什么时候?

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

微信公众号
助理微信