谷歌在2001年首次开始索引PDF。该格式通常用于政府、学术界和商业环境。
PDF 非常适合兼容性和一致性。它们几乎可以在任何设备上工作,并始终保持相同的视觉外观。但是,如果您要为 Web 创建新内容,则应考虑使用网页而不是 PDF。
今天跟大家说说如何优化独立站的PDF文档。
【如何在网页嵌入PDF文件?「PDF Viewer Elementor」】
https://www.bilibili.com/video/BV12p4y137HJ/
谷歌如何处理 PDF
PDF 被转换为 HTML 并编入索引。对于包含文本图像的 PDF,Google 使用光学字符识别 (OCR) 技术将文本图像转换为文本。PDF 中的图像也会在图像搜索结果中编入索引。
如果页面重复,Google 会选择页面而不是 PDF。如果您的网页和 PDF 文件包含相同的内容,Google 倾向于首选内容的页面版本作为重复集群的主要版本。这意味着信号将合并到页面版本,这将是搜索结果中显示的版本。
为什么PDF不适合SEO
尽管Google索引并偶尔对PDF进行排名,但与网页相比,该格式有一些缺点:
- 不适合移动设备。PDF 旨在跨设备具有一致的外观。这意味着没有适合移动设备的PDF。
- 缺乏导航。大多数 PDF 不包含导航元素,这使得人们更难浏览其他内容。
- 缺乏一些SEO属性。PDF文件具有许多SEO元素的等效版本,但也缺少许多元素,例如nofollow,UGC和赞助等单个链接属性。
- 可能不经常被抓取。由于 PDF 很少更改,因此与更新更频繁的页面相比,它们的抓取频率往往更低。
- 跟踪更加困难。最常见的跟踪器在网页上运行JavaScript,不适用于PDF文件。
也就是说,我很清楚在某些情况下无法为您的内容使用 PDF。如果是这种情况,请继续阅读以了解如何优化 PDF 以进行搜索。
如何优化 PDF
您习惯于在HTML中看到的大多数页面SEO元素在PDF中具有等效版本,并且以与您习惯相同的方式使用。许多也是出于可访问性的原因。
因此,让我们讨论一些优化 SEO PDF 的方法:
写好内容
谷歌的公司使命是组织世界信息。即使它不是网页,好的内容也是好内容。我在PDF中看到了很多很棒的内容,如技术文档,白皮书等。网络上的一些最佳信息都隐藏在PDF中。
添加优化的标题
就像网页有标题标签一样,PDF 也有标题。请注意,许多搜索引擎在其搜索结果中使用标题来描述文档。如果PDF没有标题,文件名将显示在SERP中。
以下是在 Adobe Acrobat Pro 中编辑 PDF 标题的方法:
- 单击“文件>属性”
- 编辑“标题”字段

添加优化的描述
与网页的元描述一样,这不是排名因素,但可以让您控制搜索结果中显示的文本。
- 单击“文件>属性”
- 单击其他元数据
- 编辑说明

使用相关文件名
PDF 的文件名将成为 URL 的一部分。这将影响搜索结果中显示的 URL,并且是一个很小的排名因素。
- 单击文件>另存为
- 编辑文件名

包含图像替代属性
为了帮助搜索引擎理解图像的内容,您可以向 PDF 中的图像添加替代文本。
- 单击左侧边栏中的标签图标
- 在文档层次结构中查找要为其添加可选文字的图像
- 右键单击图像
- 单击属性
- 向框中添加相关的替换文本

使用标题
就像网页中的标题标签 (H1-H6) 一样,您可以指定 PDF 中的某些文本是标题。
- 单击左侧边栏中的标签图标
- 在文档层次结构中查找要编辑的文本
- 右键单击标签
- 单击属性
- 从下拉列表中选择相关的标题级别

包含链接
就像任何页面一样,内部和外部链接也会影响排名。链接通过PageRank,其锚文本添加上下文。通过包含指向您的PDF的链接以及从PDF到其他页面的链接,您正在帮助PageRank流经您的网站,而不是创建一个死胡同。一些PDF有很多链接。拉里·佩奇(Larry Page)曾经说过:“事实证明,获得诺贝尔奖的人都有来自10,000篇不同论文的引用”
查看此 GDPR 文档。它有来自 77 个引用域的 823K 链接,但根本没有链接出去。这是一个错失的机会,从此PDF到网站上其他页面添加一些内部链接可能有助于这些页面获得更好的排名。
结语
以上就关于如何优化PDF文档的方法了,你也感觉去试试吧。