2012-04-14 521
对于robots.txt文件对于网站的作用大家都知道,但是通过观察发现,有些朋友对于robots.txt文件的规则还是有一定的误区。
比如有很多人这样写:
User-agent: *
Allow: /
Disallow: /mulu/
不知道大家有没有看出来,这个规则其实是不起作用的,第一句Allow: / 指的是允许蜘蛛爬行所有内容,第二句Disallow: /mulu/指的是禁止/mulu/下面的所有内容。
表面上看这个规则想达到的目的是:允许蜘蛛爬行除了/mulu/之外的网站所有页面。
但是搜索引擎蜘蛛执行的规则是从上到下,这样会造成第二句命令失效。正确的规则应该是:
User-agent: *
Disallow: /mulu/
Allow: /
也就是先执行禁止命令,再执行允许命令,这样就不会失效了。
另外对于百度蜘蛛来说,还有一个容易犯的错误,那就是Disallow命令和Allow命令之后要以斜杠/开头,所以有些人这样写:Disallow: *.html 这样对百度蜘蛛来说是错误的,应该写成:Disallow: /*.html 。
有时候我们写这些规则可能会有一些没有注意到的问题,现在可以通过百度站长工具 zhanzhang.baidu.com 和Google站长工具来测试。
三句话浓缩人生
生活百科 2024-05-20
纯净生活—招商臻和璟园
生活百科 2024-05-28
再别东南,无问西东
生活百科 2024-06-21
不负青春,不负梦想,热烈祝贺儿子上岸东南!
生活百科 2021-04-14
研路兜兜转转,兜兜转转研路
生活百科 2021-06-22
感恩吉大,不说再见!
生活百科 2021-09-16
不负青春,不负汗水,吉林大学,我来了!
生活百科 2017-07-20
一图看懂高考平行志愿
生活百科 2018-08-02
你好!江苏省海安高级中学!
生活百科 2014-07-01
究竟哪里才是孩子们的起跑线
生活百科 2021-05-01
软件v2rayN入门教程
电脑应用 2022-02-28
家庭常用电线平方数与功率对照表
生活百科 2020-10-30
可孚红外线体温计KF-HW-001说明书
生活百科 2020-06-28
几款可以检测电脑配置的软件
电脑应用 2023-02-07
PE装机工具推荐—FirPE
资源中心 2019-12-08
热水器回水泵(循环泵)的安装图文教程
生活百科 2018-07-17
关于“菜鸟之家”网站
资源中心 2012-03-20
东南大学硕士研究生招生常用网址整理
生活百科 2025-03-08
西蒙电气开关接线详解
生活百科 2019-02-22
心电监护仪怎么看数据
生活百科 2023-08-22
扫码二维码
获取最新动态
