HTML网站资源下载器
1251人气数
Aibi Photo AI照片增强器v1.34.0破解版
1336人气数
Photo Editor照片编辑器v9.7.1破解版
1301人气数
自由门VPN加速器
1736人气数
Telegram 电报TG 即时通讯软件
1339人气数
Little Rocket VPN 3.0 小火箭加速器3.0
1455人气数
noindex 是一项阻止 Google 搜索引擎显示(索引)您的网站的设置。有多种方法可以进行设置。目标不仅是HTML,还包括PDF文件和图像文件。在 SEO 措施方面,从索引中删除低质量内容和重复内容有望提高网站的整体声誉。 ...
noindex 是一项阻止 Google 搜索引擎显示(索引)您的网站的设置。有多种方法可以进行设置。目标不仅是HTML,还包括PDF文件和图像文件。 在 SEO 措施方面,从索引中删除低质量内容和重复内容有望提高网站的整体声誉。 另一方面,您需要小心,因为如果您滥用它或配置不正确,可能会导致您的网站流量大量损失。在这篇文章中,我们将讲解noindex怎么写、如何设置、什么时候使用、对SEO的影响以及注意点。 一、什么是无索引? noindex 是一种防止搜索引擎对网页建立索引的措施。由于该标签写在 HTML 文件中,因此也称为“noindex 标签”。 搜索引擎通过对网页进行爬行和索引来在搜索结果中反映网站信息。设置了 noindex 的页面和文件将不会被索引,并且将不再显示在搜索结果中。它也不会影响现有网站的声誉。 重复的内容和低质量的内容会降低您网站的整体声誉。通过将对 SEO 有负面影响的内容设置为 noindex 并将其从搜索结果中删除,您可以期望提高网站的评价。 1.与 nofollow 的区别 与 noindex 类似的设置是 nofollow。nofollow 是一个设置,意思是“不会抓取页面内发布的链接”,它是一个 HTML 标记。 它有时与 noindex 同时使用,但是 noindex 不会索引页面,而 nofollow 只会阻止设置的链接被跟踪。例如,您可能希望为出于引用或参考目的而包含的 URL 设置 nofollow,但您不希望将它们评估为与您的公司相关的链接。 如果您在下面描述的“robots元标记”中写入nofollow,则该页面内的所有链接都不会被抓取,但通过使用“rel属性”,您可以设置只不抓取相关链接。 首先,链接向 Google 表明网页之间的关系。如果该网站与您的网站没有直接关系,您可以通过设置 nofollow 来避免损害您网站的声誉。当引用指向您公司竞争对手的网站的链接时,它还用于设置 nofollow。 2.与 robots.txt 的差异 有一个类似于noindex的设置,robots.txt(机器人点文本)。robots.txt是一个控制搜索引擎爬虫行为的文件。 对于不希望被抓取的页面,可以在robots.txt中设置“Disallow”,阻止抓取到相应的目录或页面。 例: 拒绝访问所有 URL 不允许:/ 拒绝“○○○”目录下的 URL 并允许其他目录时 不允许:/○○○/ 尽管robots.txt本身会阻止抓取,但它不会指示页面被索引,因此它可能会通过外部站点的链接出现在搜索结果中。另一方面,noindex和nofollow不控制爬行。因此,它对爬行效率没有贡献。 二、使用noindex的案例 如果存在可能降低网站整体声誉的特定页面,请设置 noindex 以避免被搜索引擎索引。下面,我们将解释使用 noindex 的情况。
1.重复内容 当您的网站上有重复内容时,请使用 noindex。 重复内容是指内容相同或非常相似的内容,即使它具有不同的 URL(页面)。 尽管谷歌尚未公布明确的重复内容标准,但如果内容几乎相同,也可能被视为重复内容。 例如,搜索结果可能是同一页面,仅更改了都道府县的名称,但其余信息相同,或者搜索结果可能相同,但顺序和URL不同。根据用于创建网站的 CMS 的规范,可能会无意中创建重复内容。 可以在 Google Search Console 上检查可能重复的内容,或者通过将参数“&filter=0”添加到 Google 搜索中的域末尾来检查。仅保留常规 URL,并为其他重复内容设置 noindex。 2.低质量的内容 任何对用户无用的内容都称为低质量内容,可以使用noindex来防止其影响搜索结果。 为增加页面数量而创建的低质量内容,例如大量创建的仅文本略有变化的重复内容、自动生成的内容以及通过复制其他页面创建的内容。 低质量的内容单薄且缺乏原创性,因此爬虫往往会给予较低的评分。如果存在大量低质量的内容,则是不可取的,因为这可能会降低网站本身的声誉。 不应创建低质量的内容,如果网站上存在低质量的内容,则应将其替换为高质量的内容。但是,您可能还需要没有任何实质性内容的页面,例如在您的网站内搜索时返回“0 个结果”的页面。在这种情况下,请使用 noindex 来防止对站点搜索结果建立索引。 3.不需要索引的内容 首先,有些网站有不需要索引的内容,所以也为此类内容设置noindex。 例如,用于查询和下载材料的感谢页面、假设流量仅通过列表广告来创建的登陆页面以及用于下载的 PDF。 如果此类页面无意中被索引,可能会对网站有效性衡量产生负面影响。这是因为下载了本应没有导体的材料,致谢页面的PV增加了。 为不需要索引的内容编写 noindex 标记是安全的。 4.您不希望编入索引的内容 如果您不想将页面或内容编入索引,也可以设置 noindex。 例如,发布前有一些测试页,或者您只希望某些人(例如管理员或用户)查看的文件。 但是,如果您在测试页上设置了 noindex,请注意发布后不要忘记将其删除。 三、设置noindex的三种方法 设置noindex的方式主要有3种。您可以直接使用元标记编辑页面,在 HTTP 响应标头中实现它,或者如果安装了 WordPress 等 CMS,则可以使用菜单操作。 这就是设置 noindex 的方法。 1.在robots元标记中描述 这是直接在网页的HTML上写meta标签并设置noindex的方法。在“head”部分写入以下内容,搜索引擎爬虫在此读取网站信息。 2.在HTTP响应头中设置 元标记不能应用于非 HTML 文档的内容,例如 PDF、视频文件和图像文件。所以在HTTP响应头中添加一个字段并设置noindex。 HTTP 响应标头是构成对发送到服务器的请求的响应的元素之一。包含内容类型、缓存控制和连接状态等控制信息。 通过在 HTTP 响应头字段中写入“X-Robots-Tag: noindex”,您可以在 HTTP 响应头中包含与在 HTML 中写入 robots 元标记相同的效果。 在实践中,直接编辑“.htaccess”文件可能更实用。“.htaccess”文件是一个允许您以目录、扩展名等为单位控制 Web 服务器操作的文件。 例如,如果您想避免对特定 PDF 建立索引,请在“.htaccess”文件中写入以下说明并上传。 如果您不希望在搜索结果中显示特定图像,请编写如下内容: 3.设置WordPress功能等 如果您正在实施 WordPress 等 CMS,您可以轻松地在菜单上配置设置,而无需直接编辑 HTML。例如,WordPress 的标准功能允许您逐个站点设置 noindex。 即使您想为每个页面指定它,也可以通过安装 All in one SEO 等插件来实现。 四、检查noindex设置状态的两种方法 我们将介绍两种方法,让您轻松检查特定 URL(页面)是否设置了 noindex。
1.检查 HTML 源代码 仅通过查看网页无法检查是否设置了noindex。检查HTML源中是否存在相应的描述。 您可以通过使用“Ctrl+U”显示 HTML 源代码并使用“Ctrl+F”打开搜索窗口并搜索“noindex”来检查源代码中的 noindex 标记。 2.检查谷歌搜索控制台 您还可以在 Google Search Console 上检查 noindex。 您可以通过打开“页面”菜单来检查索引状态。由于 noindex 标记而未编入索引的页面在“页面未编入索引的原因”下显示为“被 noindex 标记排除”。 如果无意中设置了 noindex,请通过删除页面上的元标记来修复它。 五、无索引有效吗?设置时的注意事项 我们将解释设置 noindex 时应注意的事项,例如设置了 noindex 但在搜索结果中不反映的情况。 1.不要使用 robots.txt 阻止抓取 即使您对网页设置 noindex,它也可能不会从搜索结果中消失。在这种情况下,robots.txt 可能会阻止网页被抓取。 如果robots.txt中禁止抓取,抓取工具将无法首先抓取您的网站。即使为网页指定noindex,搜索引擎也无法读取noindex标签,因此不会反映在搜索结果中。 让我们删除不必要的描述并修复它们,以便可以正确抓取它们。 2.不要滥用 noindex 不建议滥用 noindex。通过设置 noindex,该页面的自然搜索流量将为零。 例如,即使你有大量的低质量内容,你也应该首先考虑是否有可能将其改进为高质量内容。如果太多而您无法立即改进它们,请考虑使用 noindex 并在可以改进它们后立即对其建立索引。 另外,当内容重复时,不建议轻易使用noindex。这是因为设置了 noindex 的页面将从搜索结果中删除,并且其内容的评级也将为零。 如果您想消除重复内容,请使用规范或 301 重定向来整合对正确页面的访问。通过这些操作,重复内容的评估将被转移到标准化目的地。 3.由于 noindex 无法从 Google Search Console 注册? 当您尝试从 Google Search Console 为网站编制索引时,可能会显示消息“在机器人元标记中检测到‘noindex’”,并且可能无法注册。 这是使用 WordPress 等 CMS 时的常见错误。可能在常规设置菜单中选中了“阻止搜索引擎索引我的网站”选项。如果勾选此项,将为每个站点设置noindex,这意味着发布时将无法对其进行索引。 取消选中“阻止搜索引擎对站点建立索引”以删除整个站点的 noindex。 六、概括 Noindex是一种防止特定页面、PDF文件、图像文件等被Google搜索引擎索引的措施。除了在 HTML 中编写元标记之外,还有一些方法可以向 HTTP 响应标头添加控件,并使用 CMS 上的菜单进行设置。 通过将 noindex 设置为您不希望被索引的内容(包括重复内容和低质量内容),您可以防止网站的整体声誉下降。另一方面,重要的是不要滥用 noindex,因为 noindex 页面的自然搜索流量将为零。设置noindex时,请仔细考虑页面的目的和用户的需求。 |