当过网站内容变得过时、电商网站产品售罄、网站服务器中断时,大型站点每天都会有许多页面过期。从 谷歌SEO 的角度,如何处理过期内容会极大地影响网站的自然搜索排名。如果其处理受到阻碍,带有过期内容的 SEO 页面有可能扼杀整个网站的自然排名。
1.PageRank 与用户信号
网站所有者经常提到的关于维护包含过期内容的着陆页(尤其是售罄的产品)的论点是保留传入网站的外部 PageRank。一个错误的假设是,为了保持同一着陆页具有的任何权限或 PageRank,着陆页必须保持可索引并返回 200 状态代码,即使用户不再可以使用产品或服务,随着时间的积累,这样做意味着创建一个 Soft 404 登录页面。Soft 404 是一个没有相关内容的错误页面,它不断返回 200 状态代码,而不是 404 或 410 状态代码。
出于多种原因,该策略是错误的。首先,商业网站的首要目标应该是转化率而不是假定的PageRank积累。毕竟,只要转化达到或超过预期,商家就不会关心他们的 PageRank 值是高还是低。其次,PageRank 不能以任何准确度来衡量。PageRank 会随着 Googlebot 对网络的抓取而不断变化,而且 Google 不会透露各个着陆页或网站的实际价值。没有任何外部第三方工具可以以任何有意义的方式替代该价值。最后,产品登陆页面一开始很少吸引持久的、高质量的、基于价值的反向链接。实际上,感知的 PageRank 损失是有争议的,而实际的 PageRank 损失可以忽略不计。
Soft 404 页面不利于用户体验,因此是搜索引擎(尤其是 Google)的眼中钉。这就是为什么维护过期的内容登陆页面,尤其是不可用的产品页面,会大大放大用户信号不佳的风险。谷歌在识别页面上的负面语言方面变得更加擅长,并且可以准确地检测诸如“不可用”、“缺货”、“找到 0 个结果”或“售罄”之类的字符串。通常,但并非总是如此,它会将问题突出显示为 Google Search Console 中的 Soft 404 页面。
然而,一个主要问题是 CTR 可能会受到精选片段展示的影响,突出显示用户无法获得服务或产品的信息。更糟糕的是,如果用户仍然被迫点击结果是已停用的着陆页(也称为 Soft 404),他们几乎不可避免地会返回搜索结果,寻找替代方案或优化他们的查询关键词。这样做,用户通过他们的点击行为表明个人用户体验对他们不利。随着这种“跳出率”的增长,这通常被误认为是网站不受用户的欢迎,会导致整个网站的相关性在自然搜索排名中受到影响。
虽然 PageRank 仍然是一个重要的排名因素,但与搜索引擎为排名而收集的用户信号权重相比,它显得微不足道。在坚决拒绝使用特定用户信号(例如 Google Analytics 数据或停留时间)的同时,Google 继续偏爱受用户欢迎的网站。相互比较时,PageRank 没有胜算。一方面,PageRank 仍然难以捉摸,充其量只是达到目的的一种手段。另一方面,用户信号直接为网站的成功做出了贡献,无论是 SEO 还是 SEO 之外。
2.趋势游戏
趋势是关键的 SEO 指标。越来越多的 Soft 404 页面是一个潜在的风险。
谷歌排名在很大程度上取决于 SEO 信号趋势。对于拥有数百万个相关着陆页的大型网站而言,几千个过期的内容着陆页不太可能导致排名下降。它们相对较少,无法以一种方式明确地提示网站信号的趋势。对于一个总共包含一万个登陆页面的较小的网站,几百个过期的可索引登陆页面已经构成了 SEO 排名下降的危险。
最终,决定性因素是以百分比衡量的趋势,而不是可索引的过期内容或 Soft 404 页面的实际总数。哪个网站排名好,哪个网站排名不高取决于许多关键因素。其中包括可抓取的着陆页的总量、其内容质量、所涉及的总体趋势以及最重要的是用户体验信号表明用户满意度的趋势等因素。
当 SEO 信号以及自然搜索排名需要改进时,趋势才是最重要的。特定网站在这方面的表现如何的问题只能通过分析网站的特定数据,尤其是其服务器日志来回答。这就是为什么拥有庞大且不断变化的产品数据库的商业网站必须定期进行技术 SEO 审计。
深入的 SEO 审计是准确衡量抓取预算管理或 Google 重新抓取过期的着陆页以注册应用更改可能需要多长时间的唯一方法。只有 SEO 审计可以帮助确定过期的内容登录页面是否构成问题。
3.以正确的方式做
网站的较大部分已经过时但无法删除的内容,例如网站论坛中的旧帖子,可以移出域名,从而增强主网站的趋势信号。在这种情况下,必须建立和维护 301 Moved Permanently 重定向,没有结束日期或返回 404 状态代码,以便搜索引擎知道。
然而,过期的产品登陆页面不能被 301 重定向到其他登陆页面,从而干扰用户信号。相反,当产品或服务不再可用时,相应的登录页面必须返回 404 Not Found 或 410 Gone HTTP 状态代码。这样做,这些状态代码将向 Google 和其他搜索引擎表明着陆页不再提供它们曾经提供的内容,并加强剩余的用户信号,仍然可用的 200 状态码着陆页继续提供产品或服务。
然而,有可能合法地利用 404 错误页面,而无需承担混淆搜索引擎或稀释用户信号的不必要的商业风险。那是通过增强 404 Not Found 页面,这些页面仍然返回这个正确的状态代码,并用相关的上下文信息为用户补充错误页面的内容。这些所谓的智能或自定义 404 登录页面必须继续解决其主要目的、产品或服务不可用的事实。但是,它们可以通过相关的产品替代品进行扩充或基于来自请求 URL 的关键字的内部搜索结果,使用户能够继续在网站内的旅程,并且网站运营商仍有可能利用领先优势。自定义 404 页面不是一种 SEO 增长方法,而是一种保持用户满意度和提高转化率的手段。应用后,只要状态代码仍然是 404,它们就不会带来 SEO 风险。
最终,无论过期的内容着陆页返回 404、410 还是自定义 404 响应,重要的是不要阻止 robots.txt 中的 URL。这样做会阻止搜索引擎抓取和理解应用的更改,并且可能对用户信号产生不良影响。
同时,指向过期内容登录页面的内部链接必须更新并因此停止。内部链接是最重要的页面信号之一,从抓取优先级的角度向搜索引擎表明相关性和重要性,因此提升已过期的内容登陆页面毫无意义。
最后,重要的是要始终牢记 404 Not Found 登陆页面,无论有多少,都不会影响网站的自然排名。没有哪个网站会因为或尽管有 404 Not Found 页面而排名更差或更好。然而, Soft 404 登陆页面不仅可以影响排名,而且有可能在有机搜索中拖累整个网站。