上海总结robots的定义,规则以及使用注意事项！

官网通编辑 • 2022年4月18日 am5:11 • SEO技术 • 328 阅读

总结robots的定义,规则以及使用注意事项！

在搜索引擎中Robots起到了重要的作用，不过大伙对于它并不是很了解，因此下面就来跟大伙聊聊Robots定义、规则以及使用注意事项，具体如下：

一、Robots定义

什么是Robots，简单来讲，其实Robots就是放在网站根目录下的一个TXT文件，但是这个TXT文件对搜索引擎规定，哪些页面可以访问，哪些页面不行。

Robots一般放在网站根目录下，文件名固定为robots.txt的（全部小写）、当搜索引擎要爬取我们网站的时候，会先读一下robots.txt里面的内容，判断哪些URL可以访问，哪些不行，然后进行爬取、收录。

二、Robots规则

常用的几类语法：

User-agent: 定义搜索引擎的类型
google蜘蛛：googlebot
百度蜘蛛：baiduspider
yahoo蜘蛛：slurp
alexa蜘蛛：ia_archiver
msn蜘蛛：msnbot
Disallow: 定义禁止搜索引擎收录的地址

举个例子来讲：User-agent: * Disallow: /

禁止所有搜索引擎访问网站，(*)为通配符

Allow: 定义允许搜索引擎收录的地址

User-agent: * Disallow: /a/ Allow: /a/b

如上面例子，限制搜索引擎抓取a目录，但允许搜索引擎抓取a目录下的b目录

$通配符

User-agent: * Allow: .htm$

匹配URL结尾的字符。如下面代码将允许蜘蛛访问以.htm为后缀的URL：

*通配符

User-agent: * Disallow: /*.htm

告诉蜘蛛匹配任意一段字符。如下面一段代码将禁止所有蜘蛛抓取所有htm文件：

Sitemaps位置

Sitemap: http://www.xxx.com/sitemap.xml

三、Robots使用注意事项

1、许多朋友都喜欢让搜索引擎不抓取自己的后台，于是将自己的后台地址写到robots.txt里面，其实个人不建议这样做，因为考虑到网络安全，许多Hack都喜欢通过robots.txt看大家的后台，方便攻击！

2、网站必须要有robots.txt，如果网站没有robots.txt，搜索引擎随意抓取的话，可能会抓取到一些低质量页面，从而导致网站收录、流量受到影响,如上图是没有robots.txt。

3、当我们做完robots.txt后，一定要去【百度站长工具平台】抓取、测试robots.txt，以及测试URL是否可以抓取。

本文内容由用户注册发布，仅代表作者或来源网站个人观点，不代表本网站的观点和立场，与本网站无关。本网系信息发布平台，仅提供信息存储空间服务，其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如因作品内容侵权需删除与其他问题需要同本网联系的，请尽快通过本网的邮箱或电话联系。

THE END

robots

二维码

搜索引擎关键词排名优化

< <上一篇

上海seo优化方案:开发人员必须知道的8个SEO最佳实践！

下一篇>>

搜索内容

上海总结robots的定义,规则以及使用注意事项！

每日一句

热门文章

标签云