开始您的搜索!

栏目SEO优化

   发布时间2024-6-26 14:32

   浏览人数104浏览

   转载自微信公众号微信公众号原文作者作者 未来SEO ← 查找 / 关注作者公众号

noindex 是一项阻止 Google 搜索引擎显示(索引)您的网站的设置。有多种方法可以进行设置。目标不仅是HTML,还包括PDF文件和图像文件。在 SEO 措施方面,从索引中删除低质量内容和重复内容有望提高网站的整体声誉。 ...

注明:本文摘自微信公众号:未来SEO,版权归微信公众号:未来SEO所有,请通过微信搜索公众号未来SEO,查看作者更多精彩内容。
noindex 是一项阻止 Google 搜索引擎显示(索引)您的网站的设置。有多种方法可以进行设置。目标不仅是HTML,还包括PDF文件和图像文件。
在 SEO 措施方面,从索引中删除低质量内容和重复内容有望提高网站的整体声誉。
另一方面,您需要小心,因为如果您滥用它或配置不正确,可能会导致您的网站流量大量损失。在这篇文章中,我们将讲解noindex怎么写、如何设置、什么时候使用、对SEO的影响以及注意点。
一、什么是无索引?

【谷歌SEO】什么是无索引?如何编写、设置和使用标签 | 讲解对SEO的影响及注意事项

noindex 是一种防止搜索引擎对网页建立索引的措施。由于该标签写在 HTML 文件中,因此也称为“noindex 标签”。
搜索引擎通过对网页进行爬行和索引来在搜索结果中反映网站信息。设置了 noindex 的页面和文件将不会被索引,并且将不再显示在搜索结果中。它也不会影响现有网站的声誉。
重复的内容和低质量的内容会降低您网站的整体声誉。通过将对 SEO 有负面影响的内容设置为 noindex 并将其从搜索结果中删除,您可以期望提高网站的评价。
1.与 nofollow 的区别
与 noindex 类似的设置是 nofollow。nofollow 是一个设置,意思是“不会抓取页面内发布的链接”,它是一个 HTML 标记。
它有时与 noindex 同时使用,但是 noindex 不会索引页面,而 nofollow 只会阻止设置的链接被跟踪。例如,您可能希望为出于引用或参考目的而包含的 URL 设置 nofollow,但您不希望将它们评估为与您的公司相关的链接。
如果您在下面描述的“robots元标记”中写入nofollow,则该页面内的所有链接都不会被抓取,但通过使用“rel属性”,您可以设置只不抓取相关链接。
首先,链接向 Google 表明网页之间的关系。如果该网站与您的网站没有直接关系,您可以通过设置 nofollow 来避免损害您网站的声誉。当引用指向您公司竞争对手的网站的链接时,它还用于设置 nofollow。
2.与 robots.txt 的差异
有一个类似于noindex的设置,robots.txt(机器人点文本)。robots.txt是一个控制搜索引擎爬虫行为的文件。
对于不希望被抓取的页面,可以在robots.txt中设置“Disallow”,阻止抓取到相应的目录或页面。
例:
拒绝访问所有 URL
不允许:/
拒绝“○○○”目录下的 URL 并允许其他目录时
不允许:/○○○/
尽管robots.txt本身会阻止抓取,但它不会指示页面被索引,因此它可能会通过外部站点的链接出现在搜索结果中。另一方面,noindex和nofollow不控制爬行。因此,它对爬行效率没有贡献。
二、使用noindex的案例
如果存在可能降低网站整体声誉的特定页面,请设置 noindex 以避免被搜索引擎索引。下面,我们将解释使用 noindex 的情况。
  • 重复内容
  • 低质量的内容
  • 不需要索引的内容
  • 您不希望编入索引的内容
1.重复内容
当您的网站上有重复内容时,请使用 noindex。
重复内容是指内容相同或非常相似的内容,即使它具有不同的 URL(页面)。
尽管谷歌尚未公布明确的重复内容标准,但如果内容几乎相同,也可能被视为重复内容。
例如,搜索结果可能是同一页面,仅更改了都道府县的名称,但其余信息相同,或者搜索结果可能相同,但顺序和URL不同。根据用于创建网站的 CMS 的规范,可能会无意中创建重复内容。
可以在 Google Search Console 上检查可能重复的内容,或者通过将参数“&filter=0”添加到 Google 搜索中的域末尾来检查。仅保留常规 URL,并为其他重复内容设置 noindex。
2.低质量的内容
任何对用户无用的内容都称为低质量内容,可以使用noindex来防止其影响搜索结果。
为增加页面数量而创建的低质量内容,例如大量创建的仅文本略有变化的重复内容、自动生成的内容以及通过复制其他页面创建的内容。
低质量的内容单薄且缺乏原创性,因此爬虫往往会给予较低的评分。如果存在大量低质量的内容,则是不可取的,因为这可能会降低网站本身的声誉。
不应创建低质量的内容,如果网站上存在低质量的内容,则应将其替换为高质量的内容。但是,您可能还需要没有任何实质性内容的页面,例如在您的网站内搜索时返回“0 个结果”的页面。在这种情况下,请使用 noindex 来防止对站点搜索结果建立索引。
3.不需要索引的内容
首先,有些网站有不需要索引的内容,所以也为此类内容设置noindex。
例如,用于查询和下载材料的感谢页面、假设流量仅通过列表广告来创建的登陆页面以及用于下载的 PDF。
如果此类页面无意中被索引,可能会对网站有效性衡量产生负面影响。这是因为下载了本应没有导体的材料,致谢页面的PV增加了。
为不需要索引的内容编写 noindex 标记是安全的。
4.您不希望编入索引的内容
如果您不想将页面或内容编入索引,也可以设置 noindex。
例如,发布前有一些测试页,或者您只希望某些人(例如管理员或用户)查看的文件。
但是,如果您在测试页上设置了 noindex,请注意发布后不要忘记将其删除。
三、设置noindex的三种方法
设置noindex的方式主要有3种。您可以直接使用元标记编辑页面,在 HTTP 响应标头中实现它,或者如果安装了 WordPress 等 CMS,则可以使用菜单操作。
这就是设置 noindex 的方法。
1.在robots元标记中描述
这是直接在网页的HTML上写meta标签并设置noindex的方法。在“head”部分写入以下内容,搜索引擎爬虫在此读取网站信息。

【谷歌SEO】什么是无索引?如何编写、设置和使用标签 | 讲解对SEO的影响及注意事项

2.在HTTP响应头中设置
元标记不能应用于非 HTML 文档的内容,例如 PDF、视频文件和图像文件。所以在HTTP响应头中添加一个字段并设置noindex。
HTTP 响应标头是构成对发送到服务器的请求的响应的元素之一。包含内容类型、缓存控制和连接状态等控制信息。
通过在 HTTP 响应头字段中写入“X-Robots-Tag: noindex”,您可以在 HTTP 响应头中包含与在 HTML 中写入 robots 元标记相同的效果。
在实践中,直接编辑“.htaccess”文件可能更实用。“.htaccess”文件是一个允许您以目录、扩展名等为单位控制 Web 服务器操作的文件。
例如,如果您想避免对特定 PDF 建立索引,请在“.htaccess”文件中写入以下说明并上传。

【谷歌SEO】什么是无索引?如何编写、设置和使用标签 | 讲解对SEO的影响及注意事项

如果您不希望在搜索结果中显示特定图像,请编写如下内容:

【谷歌SEO】什么是无索引?如何编写、设置和使用标签 | 讲解对SEO的影响及注意事项

3.设置WordPress功能等
如果您正在实施 WordPress 等 CMS,您可以轻松地在菜单上配置设置,而无需直接编辑 HTML。例如,WordPress 的标准功能允许您逐个站点设置 noindex。
即使您想为每个页面指定它,也可以通过安装 All in one SEO 等插件来实现。

【谷歌SEO】什么是无索引?如何编写、设置和使用标签 | 讲解对SEO的影响及注意事项

四、检查noindex设置状态的两种方法
我们将介绍两种方法,让您轻松检查特定 URL(页面)是否设置了 noindex。
  • 检查 HTML 源代码
  • 检查谷歌搜索控制台
1.检查 HTML 源代码
仅通过查看网页无法检查是否设置了noindex。检查HTML源中是否存在相应的描述。
您可以通过使用“Ctrl+U”显示 HTML 源代码并使用“Ctrl+F”打开搜索窗口并搜索“noindex”来检查源代码中的 noindex 标记。
2.检查谷歌搜索控制台
您还可以在 Google Search Console 上检查 noindex。
您可以通过打开“页面”菜单来检查索引状态。由于 noindex 标记而未编入索引的页面在“页面未编入索引的原因”下显示为“被 noindex 标记排除”。
如果无意中设置了 noindex,请通过删除页面上的元标记来修复它。

【谷歌SEO】什么是无索引?如何编写、设置和使用标签 | 讲解对SEO的影响及注意事项

五、无索引有效吗?设置时的注意事项
我们将解释设置 noindex 时应注意的事项,例如设置了 noindex 但在搜索结果中不反映的情况。
1.不要使用 robots.txt 阻止抓取
即使您对网页设置 noindex,它也可能不会从搜索结果中消失。在这种情况下,robots.txt 可能会阻止网页被抓取。
如果robots.txt中禁止抓取,抓取工具将无法首先抓取您的网站。即使为网页指定noindex,搜索引擎也无法读取noindex标签,因此不会反映在搜索结果中。
让我们删除不必要的描述并修复它们,以便可以正确抓取它们。
2.不要滥用 noindex
不建议滥用 noindex。通过设置 noindex,该页面的自然搜索流量将为零。
例如,即使你有大量的低质量内容,你也应该首先考虑是否有可能将其改进为高质量内容。如果太多而您无法立即改进它们,请考虑使用 noindex 并在可以改进它们后立即对其建立索引。
另外,当内容重复时,不建议轻易使用noindex。这是因为设置了 noindex 的页面将从搜索结果中删除,并且其内容的评级也将为零。
如果您想消除重复内容,请使用规范或 301 重定向来整合对正确页面的访问。通过这些操作,重复内容的评估将被转移到标准化目的地。
3.由于 noindex 无法从 Google Search Console 注册?
当您尝试从 Google Search Console 为网站编制索引时,可能会显示消息“在机器人元标记中检测到‘noindex’”,并且可能无法注册。
这是使用 WordPress 等 CMS 时的常见错误。可能在常规设置菜单中选中了“阻止搜索引擎索引我的网站”选项。如果勾选此项,将为每个站点设置noindex,这意味着发布时将无法对其进行索引。
取消选中“阻止搜索引擎对站点建立索引”以删除整个站点的 noindex。
六、概括
Noindex是一种防止特定页面、PDF文件、图像文件等被Google搜索引擎索引的措施。除了在 HTML 中编写元标记之外,还有一些方法可以向 HTTP 响应标头添加控件,并使用 CMS 上的菜单进行设置。
通过将 noindex 设置为您不希望被索引的内容(包括重复内容和低质量内容),您可以防止网站的整体声誉下降。另一方面,重要的是不要滥用 noindex,因为 noindex 页面的自然搜索流量将为零。设置noindex时,请仔细考虑页面的目的和用户的需求。
#谷歌SEO#什么是无索引#如何编写#设置和使用标签#讲解对SEO的影响及注意事项
版权声明:文章内容摘自于微信公众号:未来SEO,版权归微信公众号:未来SEO所有,本站仅出于分享(非商业盈利)目的转载,该文章仅代表作者本人观点,不代表本站观点!如转载侵犯了您的权益,请来信告知:ishiqingwu@qq.com,我们在收到来信的第一时间处理。
返回顶部