Home » SEO-搜索引擎优化 » WordPress博客robots.txt写法

使用Wordpress搭建的博客,利用robots.txt文件限制搜索引擎抓取部分目录及文件,归纳大致有以下几种方法。

最简单的开放写法

不作任何限制,Wordpress站内链接结构比较合理,作为一般博客,完全开放就可以了,代码:

User-agent: *
Disallow:

允许所有蜘蛛访问,允许访问所有内容。Wordpress只要模板中链接设计合理,没有需要限制的特殊内容,推荐使用这种写法。

最简单的严格写法

User-agent: *
Disallow: /wp-*
#Allow: /wp-content/uploads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?s=

允许所有蜘蛛访问,限制以“wp-”开头的目录及文件,限制抓取.php文件、.inc文件、.js文件、.css文件,限制抓取搜索结果。

Disallow: /wp-* 会连同附件目录一起限制抓取,如果想让搜索引擎抓取附件中的内容,将第三行的 # 号注释去掉。Allow 不是所有搜索引擎都支持。

最合理的写法

卖瓜的都说自己瓜甜,我也觉得自己的Robots.txt写的最合理 😛

User-agent: *
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-includes
Disallow: /?s=
Sitemap: http://www.lesishu.com/sitemap.xml

允许所有搜索引擎抓取,逐一列举需要限制的目录,限制抓取搜索结果。

包含sitemap.xml地址(这一项viki中有专门的说明,但Google管理员工具会提示‘检测到无效的 Sitemap 引用’,有效性尚有争议)。

robots.txt其他写法

为避免在搜索引擎中出现重复页面,Wordpress玩家自创了很多robots写法,列举一些常用的,作为参考(适用于伪静态方式的永久链接):

Disallow: /page/

#限制抓取Wordpress分页

Disallow: /category/*/page/*

#限制抓取分类的分页

Disallow: /tag/

#限制抓取标签页面

Disallow: */trackback/

#限制抓取Trackback内容

Disallow: /category/*

#限制抓取所有分类列表

最后,推荐使用 Google管理员工具,登录后访问“工具 -> 分析 robots.txt”,检查文件有效性。

作者:樂思蜀
原文:WordPress博客robots.txt写法
版权所有,转载时必须以链接形式注明作者和原出处并保留本声明。

48 Comments

  1. 稻草神 says:

    暂时用不上,数学老师说看贴回贴,顶下人家是好孩子……..水平把俺限制在Z-blog

  2. soz says:

    谢谢分享:-)

  3. 网名 says:

    偶也暂时用不上.不过每次看人家的文章总得或多或少的做个评论吧

  4. seo服务 says:

    正准备用这个博客…

    不过感觉主题方面有点不好入手.

  5. 我一直在用呢,这个东西很简单的,用一次就明白了

  6. 新疆seo says:

    不错了,这个还从来没有认真研究过呢!

  7. 卖瓜的都说自己瓜甜,我也觉得自己的Robots.txt写的最合理 🙂

  8. 禅猫 says:

    非常受用。感谢!

  9. 新鲜人 says:

    请问 Disallow: /category/*/* #限制抓取分类的分页 有什么好处?

  10. daniel says:

    不错,正在学习中

  11. 深圳seo says:

    一般都是空白的

  12. 苏州SEO says:

    卖瓜的都说自己瓜甜,我也觉得自己的Robots.txt写的最合理

    你忽略了一个最重要的,你的Robots.txt写错了 文件名应该是robots.txt小写的,你写成大写搜索引擎不会理会你里面写的什么内容的

  13. vera says:

    学习当中,受教了。。。。。。

  14. jssay says:

    感谢分享,看过很多类似的文章,感觉都很有道理。就像博主说的:卖瓜的都说自己瓜甜,还是要靠自己摸索,领悟,这只是一个参考而已。

  15. kafeier says:

    差不多,要有的东西真不能少呀。

  16. 太阳博客 says:

    写法挺多的,要注意啊

  17. coffee says:

    受教了,主要是想不让搜索引擎收录含wp-的文件和目录

  18. imyuanb says:

    SEO精通其实挺难的

  19. Youke says:

    真好!
    正需要呢

  20. 千年私服 says:

    这个写的好,要不后台也被抓去了,里面全是英文,不友好。

  21. 博主写得很不错,不过据我了解,WordPress好像可以不用写呢

  22. 博主写的不错,对SEO非常有用,不然很多重复页面。多谢了

  23. 正在找这个。。也学习下~我的站被百度K得不行了~因为换了文章路径

  24. 泉州seo says:

    🙂 z这个robots写的不错哦。

  25. robots.txt其他写法还没弄大明白,本来就需要静态化,为什么要限制这些静态化页面的访问呢?

  26. 亿品 says:

    单篇文章分页的禁止抓取该怎么写??

  27. xqiushi says:

    的确不错,我借用了

  28. 贝佳斯 says:

    请教博主dede程序robots文件怎么写比较合理?

  29. 冬雪 says:

    可恨的是我明明知道robots.txt文件怎么写,但是上传到FTP时,打开网站查看时却是另外的样子,问空间商也不鸟我,真是郁闷死死。

  30. 心理咨询 says:

    拜读过,值得收藏的文章

  31. jack says:

    好文,支持!内容详细

  32. 兄弟你的这篇文章非常有参考价值~

  33. hao123 says:

    如果不写有没有影响

  34. 長毛瘦馬 says:

    介绍的很详细,谢谢@-@很受用!

  35. 济宁SEO says:

    博主的文章权重真是高啊,几年前的文章搜索还能排在第一的位置,厉害
    参考了博主的robots.txt

  36. 黎康博客 says:

    这个文件写了还真有用,有的目录不能让蜘蛛收录

  37. ipsiri says:

    把最合理的写法和自创的写法一起用了。

  38. 小李 says:

    正在找这个,但是他们都不这样写

  39. Disallow: /?s=
    Sitemap: http://www.lesishu.com/sitemap.xml

    这是什么意思?是限制抓取这个结果吗?

  40. 小学生 says:

    看了,很多,我这就去修改一下

  41. 苏州SEO says:

    有个别目录不认识,像插件、主题这类目录都应该需要屏蔽的吗 话说我的博客都允许收录

  42. 谷德宝 says:

    博主的robots.txt写的过于简单,很多动态网址都没有屏蔽掉

Leave a Reply