保持简单的网址结构
保持简单的网址结构
网站的网址结构应尽可能简单些。建议您组织一下您的内容,让网址的结构合乎逻辑并易于人们理解(尽可能采用易读的字词而非冗长的ID编号)。例如,如果您要搜索有关aviation的信息,http://en.wikipedia.org/wiki/Aviation一类的网址将可帮助您决定是否点击该链接。而 http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 一类的网址对用户的吸引力大大降低。
考虑在网址中使用标点符号。对于我们而言,http://www.example.com/green-dress.html这一网址比http://www.example.com/greendress.html有用得多。我们建议在网址中使用连字符(-)而非下划线(_)。
过于复杂的网址,特别是那些包含多个参数的网址,可能会给抓取工具带来麻烦,因为它们可能会产生大量不必要的网址,全都指向您网站上相同或相似的内容。Googlebot可能会因此而消耗大量不必要的带宽,也可能无法将您网站上的所有内容完整编入索引。此问题的常见原因
导致网址过多可能有多种原因,其中包括:
对一组项目的过度过滤 很多网站为同一组项或搜索结果提供不同的视图,通常可让用户使用定义的标准进行过滤(例如:显示海景酒店)。当以累加方式合并过滤器时(例如:带健身中心的海景酒店),网站中网址(数据视图)的数量就会急剧增加。因为Googlebot只需查看少量能用来访问各个酒店网页的列表即可,所以没有必要创建大量区别不大的酒店列表。例如:
特价酒店:
特价海景酒店:
带健身中心的特价海景酒店:
动态生成文档。由于计数器、时间戳或广告影响,这可能会产生少量变化。
网址中的问题参数。例如,会话ID会创建大量重复内容以及较多网址。
排序参数。 某些大型购物网站会提供多种方式来为相同的商品排序,从而造成网址数量大增。例如:
网址中不相关的参数,例如引荐参数。 例如:
日历问题。 动态生成的日历可能会生成指向未来及过去日期的链接,而这些日期没有开始或结束期限。例如:
相对链接损坏 。损坏的相对链接往往会导致无限循环。这个问题通常是由路径元素重复造成的。例如:
解决此问题的方法
为避免网址结构出现潜在问题,建议您采取以下措施:
您可考虑使用robots.txt文件阻止Googlebot访问有问题的网址。一般情况下您应考虑阻止动态网址,例如会生成搜索结果或无限循环(如日历)的网址。在robots.txt文件中使用正则表达式可以轻松拦截数量较大的网址。
截掉不必要的参数,尽量缩短网址。
检查网站是否存在损坏的相对链接。
Last updated
Was this helpful?