如何找到任意网站的站点地图sitemap

📚 文章大纲

查找任何网站的站点地图都相对容易,在这里我们将帮助您完成此任务。我们将从最常见的站点地图格式(XML)开始,然后介绍其他一些格式。

首先,让我们从基础知识开始。

什么是站点地图

XML站点地图是网站上页面的列表,旨在帮助不同的搜索引擎。它提供有关您网站上的 URL 的重要信息,包括页面、视频、图片、文件及其关系。除了页面之外,XML 站点地图还包括有关每个 URL 的其他元数据

  • 最后更新日期
  • 变化频率
  • 与其他页面相比,它的优先级更高。

就SEO 最佳实践而言,站点地图应进行优化,以仅包含可索引的优质内容。其中的任何损坏 (404)、重定向或重复页面都可能使搜索引擎感到困惑。

站点地图就像是网站的轮廓。它以代码格式构建,通常如下所示:

SEO爬行站点地图

或者像这样:

网站地图 XML

为什么需要查找站点地图?

我们已经介绍了站点地图的基础知识,包括其主要用途。现在让我们看看为什么我们首先要找到这些文件。

正如我们上面所讨论的,站点地图是一种不可替代的简单方法,可以告知搜索引擎,特别是他们的爬虫(例如Googlebot)有关我们网站上的重要内容。

首先,您可能需要检查您是否有 XML 站点地图。 如果有,下一步就是检查它,看看它是否正确创建并包含正确的信息。

最后,如果您没有站点地图,您可能需要创建一个并提交给搜索引擎。请注意,XML 站点地图并非强制性的。但它们仍可帮助搜索爬虫更快地找到、索引并最终对新网站和网页进行排名。

现在是时候深入侦探工作并找到那些站点地图了!

准备好了吗?出发!

查找站点地图的简单方法

让我们从一些最简单的查找网站站点地图的方法开始我们的旅程。

1)手动检查常见的 XML Sitemap 位置

查找网站的 XML 站点地图的最常见(也是最简单的)方法之一是
手动检查几个标准位置。这非常简单,您只需在浏览器中输入您的网站网址,然后尝试几个不同的变体即可。让我向您展示:

  • www.YourWebsiteUrl.com/ sitemap.xml

这是最受欢迎的地点,但不是唯一的地点。因此,如果我们第一次尝试不成功,可以尝试以下几个快速检查:

  • /sitemap_index.xml(如果网站有多个站点地图,则为所有站点地图的索引)。

我们博客上的XML 站点地图就是这种情况。让我向您展示一下:

站点地图的 URL SEOcrawl

它看起来是这样的:

SEOcrawl 站点地图列表

基本上,这些都是单独的站点地图,根据其内部的帖子类型进行划分。

现在,如果我们仍然不走运,让我们尝试更多的选择:

  • /sitemap-index.xml
  • /sitemap.php
  • /sitemap.txt
  • /sitemap.xml.gz
  • /sitemap/
  • /sitemap/sitemap.xml
  • /sitemap-index.xml
  • /sitemap/index.xml
  • /sitemap1.xml

注意:XML 文件只是描述站点地图的其中一种方式。还有RSSAtom格式。

因此,我们需要添加更多可能的站点地图位置:

  • /rss/
  • /rss.xml
  • /atom.xml

我们稍后会进一步讨论它们。

只是为了确认——在尝试各种替代方案时,我们应该将网站的域名放在“/”之前。

2)检查Robots.txt文件

如果您仍在关注我们,那意味着您要么未能找到该文件(这是我们撰写本文的主要目的),要么只是好奇并热衷于了解更多信息。

事实上,无论确切的原因是什么,我都有一个好消息要告诉你——我们将通过另一个非常简单的提示继续我们的旅程。

Robots.txt是 SEO 人员(以及程序员)熟知的一个特殊文件,它为搜索引擎爬虫提供有用的指令。此外,您通常还可以在这里找到网站站点地图的链接。

这个想法是,当搜索引擎访问这些robots.txt文件时,在其中添加指向站点地图的链接是非常合理的。这样一来,搜索引擎就可以更轻松地首先检测到站点地图并抓取网站。

您准备好迎接另一个好消息了吗?!这里就是 – 要访问网站的robots.txt文件,您只需要在浏览器中将/robots.txt添加到您的域名并按“ Enter ”。这类似于上一步,我们在其中添加了不同的可能的站点地图路线。

有什么比现实生活中的例子更有效呢?请查看我们自己的 robots.txt 文件的 URL 地址:

https://shelleydigital.com/robots.txt

这是一个很小但简单实用的文件,具有一些重要功能。如果您已经打开它,您将能够几乎立即看到您正在寻找的小宝贝 – 站点地图文件:

瞧!我保证过这很容易 🙂

3)检查 Google 搜索控制台

好的,仍然找不到站点地图?没问题!我们还有更多提示可以帮助您找到方向。

让我向您展示另一种简单快捷的方法。

Google Search Console (以前也称为网站管理员工具)是另一个可以找到我们正在寻找的路径的地方。当然,要做到这一点,您必须是网站所有者或被授予访问权限。

如果您满足这些条件之一,下一步是登录 GSC 并从左侧菜单中选择站点地图

Google Search Console 中的站点地图

现在,如果站点地图(或站点地图)过去已由其他人提交,您将能够立即看到它:

已提交的站点地图

除了站点地图的确切 URL 地址外,还有其他信息,例如站点地图的类型(包含其他站点地图的索引文件或带有网站页面的常规站点地图)、提交时间、上次阅读时间、状态以及其中有多少个 URL。

提示:如果您认真对待 SEO 并改善您的自然网站性能,Google Search Console是必备工具。您可以从中获得很多见解。

4)检查Bing网站管理员工具

好消息是,Bing 网站管理员工具的工作方式与Google Search Console基本相同。后者曾被称为Google 网站管理员工具,这并不奇怪,因为它们有很多共同之处。

再次,您需要登录,然后导航到左侧边栏,您将在那里看到“站点地图”部分。

Bing 网站站长工具中的站点地图

单击它,如果已经提交了站点地图,您将能够进一步探索它们。

在 Bing 网站管理员工具中提交的站点地图

查找站点地图的高级方法

还在吗?好吧,这意味着你要么仍在寻找那个珍贵的站点地图文件位置,要么你非常勇敢地进入高级部分。无论是哪种情况,我都想祝贺你走到今天这一步,祝你好运 🙂

5)使用谷歌搜索运算符

Google 搜索运算符(也称为命令)对于各种 SEO 目标(例如,查找链接建设机会、内容创意、发现技术问题等)可能非常有用。但是,在这种情况下,我们将使用它们来查找我们正在检查的网站的 XML 站点地图。

为此,我们需要利用“ filetype :”命令。当我们将它与“ site :”命令结合使用时,它会非常有用。基本上,两者的组合将仅在我们想要的网站中查找特定文件类型。

例如:site:chess.com filetype:xml

以下是此搜索在 Google 中显示的结果:

使用 Google 搜索运算符查找站点地图

我们找到了!网站的所有索引站点地图都显示在 Google 中,我们可以进一步探索它们。

如果显示了一些不相关的结果,您可以进一步优化搜索。这次我们将在我们的工具库中添加“ inurl ”运算符。

例如:site:uefa.com filetype:xml inurl:sitemap

使用 inurl 运算符查找站点地图

注意:正如我们上面提到的,站点地图也可以是文本文件。为了找到它们,我们可以进行类似的搜索,但使用不同的扩展名。

例如:site:WebsiteURL inurl:sitem a p filetype:txt

这将导致以下结果:

操作文件类型来查找站点地图

提示:这些命令仅在站点地图被 Google 编入索引时才会显示站点地图的位置。一些创建站点地图的 WP 插件会自动将no follow、no index标签添加到站点地图。因此,如果您最终没有找到任何结果,请不要担心!

让我们继续下一个想法。

6)使用在线工具

另一种方法是尝试使用SEO Site Checkup等在线工具,您只需粘贴您的网站 URL 并点击Checkup即可。然后您将得到类似以下内容:注意:此工具的工作方式是检查我们之前提到的标准站点地图位置(sitemap.xml、sitemap1.xml、sitemapindex.xml等)。因此,在其他特定情况下,它可能找不到您的网站。

7)检查网站的内容管理系统 (CMS)

根据网站所运行的内容管理系统,XML 站点地图可能位于不同位置。好消息是,最流行的 CMS 都有默认位置,您可能希望从这些位置开始搜索。

首先,我们需要确定网站的CMS 。这是一个相当简单的过程,我们可以使用在线工具或浏览器扩展。

例如,一个有用的插件是Built With,它不仅可以识别 CMS,还可以识别网站正在使用的许多其他软件和程序。它显示您正在寻找的信息的方式如下:

如果您更喜欢使用在线工具,一个可能的解决方案是WhatCMS

另一种方法是CMS Detect

CMS 检测 SEOcrawl

现在,当我们了解了确切的 CMS 后,让我们来探索一些最流行的内容管理系统以及它们通常保存 XML 文件的位置。

WordPress

在 2020 年之前,创建站点地图的方式主要是通过插件。但是,现在有了内置的 WP 功能,它们应该位于/wp-sitemap.xml

不过,如果您正在检查的网站正在使用插件创建站点地图,您可以尝试以下一些位置:

  • /sitemap.xml
  • /tag-sitemap.xml
  • /sitemap_index/xml
  • /category-sitemap.xml

或者,您可以检查插件的设置并在那里找到路径。

Wix、Shopify、Joomla、Squarespace、Magento

好消息是,所有这些都会自动为其用户生成 XML 站点地图。
因此,默认位置(如果没有额外修改)是:
/sitemap.xml

请注意,域名位于“/”部分之前。

奖励:用于即时发现 Sitemap.xml 的书签

如果您热衷于提高工作效率并从每项小任务中节省时间(我们所有的 SEO 不都是这样的吗?!),那么您可能会发现一个有用的快速书签可以立即检查网站的 XML 站点地图。

您只需添加此 javascript 代码:

javascript:void(location.href=’http://’ + location.host + ‘/sitemap.xml’)

将其添加为书签,每次单击它时都会打开站点地图文件,以防它位于默认的 /sitemap.xml 位置。

快捷方便!

查找其他类型的站点地图

我们主要讨论了 XML 站点地图,因为它是向爬虫展示您域中正在发生的事情的最常见格式。不过,值得一提的是,某些网站上也可以找到其他类型的站点地图。

  • HTML。这些通常是为了方便用户而制作的,它们非常有用,尤其是对于较大的网站。

例如,Ebay 为访问者提供包含主页和类别的虚拟“地图”: https://pages.ebay.com/sitemap.html

  • RSS . 在某些情况下,网站使用 RSS 提要作为站点地图,通常位于:/rss/ 或 /rss.xml。
  • Atom。Atom feed 也是如此,您通常可以通过以下地址找到它:/atom.xml
  • TXT。这是一个标准文本文件,我们已经讨论过一个这样的示例。位置:/sitemap.txt

没有站点地图?这种情况该怎么办?

在介绍了查找站点地图的不同选项之后,最好说几句如果没有创建站点地图该怎么办。大多数上线时间不长的全新网站都会遇到这种情况。或者一些非常小的网站。

另外,请注意并非所有网站都需要站点地图。如果网站只有几页,即使没有站点地图也行。

不过,如果您愿意创建 XML 站点地图,您可以简单地使用与您的 CMS 系统兼容的插件。WP 的一些很好的例子是:

  • Rank Math SitemapPlugin
  • WP Sitemap Plugin
  • Google XML Sitemap
  • Yoast WordPress SEO

或者,您可以手动创建站点地图或使用爬虫程序浏览您的网站并导出站点地图进行上传。

总结

我希望这些技巧能帮助您更深入地了解站点地图的世界,并且您现在更加熟悉它们的工作原理、我们为什么需要它们……当然还有如何找到它们。

如果您想了解其他信息或只是想分享您的经验,请在评论中告诉我们 🙂

发表回复

添加微信