Hi Jason
  • About
  • Keywords
    • keywords - 2021/01
    • Keywords - 2020/08
    • Keywords - 2020/07
  • Note
    • 2021
    • 2020
      • 伊拉克域名.IQ被美国删除的背后以及早期的根域名管理
      • 美国如果把根域名服务器封了,中国会从网络上消失?
      • The Technical Data Guidance
    • 缓慢收藏, 小心整理
      • 泰戈尔诗句节选
    • 金刚经 原文 | 抄经
  • Read
    • 符号
    • 段永平投资问答录
      • 符号的设计
      • 符号形式探寻
      • 作为符号的设计(上篇)
      • 作为符号的设计(下篇)
      • 符号化设计之符号形式探寻
    • Dark Mode
      • Dark Mode的设计要点
      • 一篇吃透 Dark Mode ,搞定“暗黑/深色”适配
    • Apple
      • Apple “无缝”设计之历程
      • Apple 那些“无关紧要”的设计改进
      • HomePod 的设计
      • 解决方案、设计、好设计,Apple UI 设计中的 Tuning
      • Apple 的 Logo 设计
      • J 的艺术,R 的艺术
      • 从圆角到圆角
      • Apple 颜色设计的历程
      • 欲望、逻辑和习惯
      • 反“建筑学”的 Apple Park 将刺激建筑的发展
      • 螺钉,还是胶水?
      • 关于苹果设计的书籍和文章推荐
      • 正面冲撞习惯
      • 从 iOS 7 的电话图标到 polyoxybenzyl…
      • Affordance(可供性)和设计
      • 美的感知力
      • 2010: A Design Odyssey
      • iPad,从 niche 到 mass
  • Source
    • Nginx
      • 前言
      • Nginx入门
      • Nginx 配置文件
      • Nginx 内存池管理
      • Nginx 基本数据结构
      • Nginx 数组结构 ngx_array_t
      • Nginx 链表结构 ngx_list_t
      • Nginx 队列双向链表结构 ngx_queue_t
      • Nginx 哈希表结构 ngx_hash_t
      • Nginx 红黑树结构 ngx_rbtree_t
      • Nginx 模块开发
      • Nginx 启动初始化过程
      • Nginx 配置解析
      • Nginx 中的 upstream 与 subrequest 机制
      • Nginx 源码结构分析
      • Nginx 事件模块
      • Nginx 的 epoll 事件驱动模块
      • Nginx 定时器事件
      • Nginx 事件驱动模块连接处理
      • Nginx 中 HTTP 模块初始化
      • Nginx 中处理 HTTP 请求
      • Untitled
      • Untitled
    • Part 1
      • curl
  • Google Dev
    • 重要概念
      • Google 搜索的工作方式
      • 什么是展示次数、排名和点击次数?
      • 关于我们的统计信息和数据
    • Search Console帮助
      • 指南概览
      • 网站站长指南
      • 常规指南
        • 搜索引擎优化 (SEO) 新手指南
        • 使用 HTTPS 确保网站安全
        • 保持简单的网址结构
        • 向 Google 说明您的出站链接的用意
        • 将网站标记为面向儿童的内容
        • 浏览器兼容性
        • 避免创建重复内容
        • 确保链接可供抓取
        • 借助 Google 搜索进行网站测试的最佳做法
      • 专门面向内容的指南
        • 与 Google 搜索中的 AMP 网页相关的准则
        • AJAX 增强网站
        • 图片和视频
          • Google 图片最佳做法
          • 图片站点地图
          • Google 图片中的图片权限元数据
          • 视频最佳做法
          • 视频 Sitemap 及其替代方案
          • 有关富媒体文件的最佳做法
        • 播客
        • Google 移动
          • 在功能手机上进行移动浏览
          • Web Light:在搜索结果中提供更快速且更精简的移动版网页
          • Google 搜索中的 Web Light 网页对广告网络的支持
          • Google 探索和您的网站
          • 实用资源:面向适合在移动设备上显示的网页的开发者
          • 将移动网络结算费用明确告知用户
          • 将 Android 应用与网站相关联
      • 质量指南
    • Google Cloud CDN
      • 使用拖管实例组设置 Cloud CDN
      • 使用后端存储分区设置 Cloud CDN
      • 使用缓存键
      • 查看日志
  • Guidebook
    • Color Guide
    • Material.io
  • Navigation
    • Google
    • Social & Study
    • Working Tools
Powered by GitBook
On this page

Was this helpful?

  1. Google Dev
  2. Search Console帮助
  3. 常规指南

避免创建重复内容

Previous浏览器兼容性Next确保链接可供抓取

Last updated 4 years ago

Was this helpful?

重复内容通常是指网域内或网域间与其他内容完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质。非恶意重复内容可包括:

  • 既可生成常规网页,又可针对移动设备生成精简版网页的论坛

  • 通过多个不同网址显示或链接的存储项

  • 网页的可打印版本

如果您的网站有多个包含大量重复内容的网页,您可以采用多种方法向 Google 指明您的首选网址(该过程称为“规范化”)。

不过,在某些情况下,网域间会有故意重复的内容,意在操纵搜索引擎的排名或赢得较多的流量。这种欺骗性做法会使用户在同一组搜索结果中看到实质相同的内容重复出现,从而导致糟糕的用户体验。

Google 会尽量保证编入索引和显示的网页包含不同的信息。该过滤操作意味着,如果您网站的每篇文章都有“常规”和“打印”两个版本,而且两个版本都未被系统根据 屏蔽,那么我们会选择其中一个版本列出。仅在极个别情况下,Google 才会认为重复内容的用意是操纵我们的排名并欺骗我们的用户,当此类情况出现时,我们也会对相应网站的索引和排名进行适当的调整。这样一来,网站的排名可能会受到影响,或者我们可能会将网站从 Google 索引中完全移除,网站移除后将不会再显示在搜索结果中。

您可采取一些措施来主动解决内容重复的问题,并确保访问者可看到您希望他们看到的内容。

  • 使用 301 重定向:如果您已调整网站结构,那么请在 .htaccess 文件中使用 (“RedirectPermanent”)灵活地重定向用户、Googlebot 和其他“蜘蛛”程序(在 Apache 中,您可在 .htaccess 文件中进行以上操作;而在 IIS 中,您可通过管理控制台来进行以上操作)。

  • 保持一致:尽量使您的内部链接保持一致。例如,请勿链接到 http://www.example.com/page/、http://www.example.com/page 和 http://www.example.com/page/index.htm。

  • 使用顶级域名:为便于我们选用最恰当的文档版本,请尽量使用顶级域名来处理针对特定国家/地区的内容。例如,与 http://www.example.com/de 或 http://de.example.com 相比,http://www.example.de 更能说明这是针对德国的内容。

  • 联合供稿须谨慎:如果您在其他网站上将您的内容显示为联合供稿,那么,在每次搜索中,Google 都会始终显示我们认为最适合用户的版本,这有可能是您的首选版本,也有可能不是您的首选版本。不过,您可以采用一种有益的做法:确保以联合供稿形式展示相应内容的每个网站都包含一个指回原创文章的链接。您也可要求其他网站的站长对包含您的联合供稿资料的网页使用 noindex 元标记,从而阻止搜索引擎将那些版本编入索引。

  • 最大限度地减少重复的样板文字:例如,不在每个网页的底部添加冗长的版权文字,而只添加一段简短摘要,然后链接到能够提供详细信息的网页。此外,您还可以使用指定您希望 Google 如何处理网址参数。

  • 避免发布无实际内容的网页:用户不喜欢看到“空白”网页,因此请尽量避免使用占位符。例如,请勿发布尚无实际内容的网页。如果您确实创建了占位符网页,请使用 阻止搜索引擎将这些网页编入索引。

  • 了解自己的内容管理系统:请务必熟悉内容在您网站上的显示方式。博客、论坛以及相关系统往往会以不同的格式显示相同的内容。例如,某个博客条目可能会显示在博客首页、存档网页以及包含带有同一标签的其他条目的网页中。

  • 最大限度地减少相似内容:如果您的多个网页内容相似,那么,请考虑扩充每个网页的内容,或将这些网页合并成一个。例如,如果您的旅行网站上包含与两个城市分别对应的不同网页,但这两个网页中的内容相同,您便可将这两个网页合并为一个网页来同时介绍这两个城市的相关信息,或者扩充每个网页的内容以使其包含相应城市的独特信息。

Google 不建议使用 robots.txt 文件或其他方法阻止抓取工具访问您网站上的重复内容。如果搜索引擎无法抓取包含重复内容的网页,便无法自动检测这些网址是否指向相同内容,因此,实际上还是被迫将它们视为独立的不同网页。还有一个更好的解决方案,就是允许搜索引擎抓取这些网址,并使用 rel="canonical" link 元素、网址参数处理工具或 301 重定向将这些网址标记为重复内容。如果重复内容导致我们抓取了您网站的过多内容,您还可以在 Search Console 中。

除非重复内容看上去意在欺骗用户以及操纵搜索引擎结果,否则,我们不会对含有重复内容的网站采取措施。如果您的网站存在内容重复问题,但您并未采纳上述建议,我们通常能够选择适宜的内容版本并显示在搜索结果中。

但是,如果我们审查发现您采用了欺骗性做法,并且您的网站已从我们的搜索结果中移除,请仔细检查您的网站。如果您的网站已从我们的搜索结果中移除,请参阅了解详情。如果您已进行更改并确信网站不再违反我们的指南,请。

在极少数情况下,我们的算法可能会选择未经您的允许就托管您的内容的外部网站上的网址。如果您认为其他网站违反版权法抄袭了您的内容,可以与该网站的站长联系,要求其移除相关内容。此外,您还可以,以请求 Google 从搜索结果中移除涉嫌侵权的网页。

详细了解规范化。
noindex 元标记
301 重定向
参数处理工具
noindex 元标记
调整抓取速度设置
网站站长指南
提交重新审核网站的请求
根据数字千年版权法案提交请求