我的网站上个月被百度"关照"了。site:域名直接搜不到结果,索引量从两千多掉到一千多。折腾了快一个月,终于找到原因:robots.txt写错了。
今天把这5个错误整理出来,都是我自己踩过的坑。
1. robots.txt不是越开放越好
我之前以为,robots.txt要尽量放开,让蜘蛛多抓。于是把/tag/、/author/、/date/全放行了。
结果6月7号那天,百度蜘蛛来了554次。平时也就两百多次。它把全站的标签页、作者页、日期页扫了一遍,然后判定:这站低质量页面太多。
降权就这么来了。
标签页这种聚合页,内容单薄又重复,默认就该屏蔽。我现在改成:
User-agent: *
Disallow: /tag/
Disallow: /author/
Disallow: /date/
2. 低质量页面要加noindex
robots.txt只能挡住未来的抓取。已经被百度收录的那些标签页、作者页,还躺在索引里。
需要在主题的functions.php里加一段代码:
add_action('wp_head', function(){
if (is_tag() || is_author() || is_date()) {
echo '<meta name="robots" content="noindex,follow">';
}
});
这样百度再来抓,看到noindex就会把这些页面清掉。
3. 删文章别直接删
我清理低质量文章的时候,直接点了删除。没做301,也没立刻提交死链。
如果文章本来就没价值,提交死链可以。但如果它有排名、有外链,最好301到相关文章。不然流量和权重都白白浪费了。
4. 索引量多不等于好事
我以前天天盯着索引量看,觉得数字越大越好。两千多篇,多有面子。
后来发现,这两千多篇里,大量是标签页、重复页、低质页。真正有价值的没多少。
百度现在更看重质量。宁要100篇精品,不要1000篇垃圾。
5. 别光发AI生成的内容
这个坑我踩得不深,但见过太多人踩。AI写的文章顺是顺,但缺少真实经验。读者看了觉得"好像说了什么,又好像什么也没说"。
百度对这类内容的识别越来越准。我现在要求自己每篇文章都手写,写自己真正用过的工具、真正解决的问题。
结语
我的站还在恢复中。该改的技术问题都改了,剩下就是坚持发高质量内容。
如果你是WordPress新手,这5个坑能避开就避开。SEO这场马拉松,急不得。

暂无评论,来说点什么吧~