1、屏蔽搜索引擎重复收录网页
有的网站配置了静态规则,同一个网页中,有些网站可以用静态网址打开,有些可以用动态网址打开。如果搜索引擎都把两种不同形式的网址的同一个网页内容收录,搜索引擎可能认为你的网站作弊,从而给予降权。而robot.txt刚好可以解决这个问题,避免网站受到处罚。
2、提高蜘蛛的爬行效率
小的企业站本来流量不高,排名不好,蜘蛛来的少,要是过多的去爬去一些没有意义的内容,可能分散了一些优质内容的爬行几率。禁止一些页面可以培养蜘蛛的爬行习惯
3、保证服务器性能
Robots可以避免将所有程序文件被蜘蛛索引,可以节省服务器资源。
Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;还可以屏蔽站点的一些死链接。