利用 Html 元标记控制搜索引擎蜘蛛,meta name="robots" 详解

精贴 置顶
1607 0

META标签的Robots

写法为:

 name="Robots" contect="信息参数">

Robots代表告诉搜索引擎机器人抓取哪些页面

其中的属性说明如下:

all:文件将被检索,且页面上的链接可以被查询;

none:文件将不被检索,且页面上的链接不可以被查询;

index:文件将被检索;

follow:页面上的链接可以被查询;

noindex:文件将不被检索,但页面上的链接可以被查询;

nofollow:文件将被检索,但页面上的链接不可以被查询;

noarchive:文件将被检索,但禁止保存快照;


快照不被百度缓存:

 name="Baiduspider" content="noarchive">

所有搜索引擎,抓取这个页面、爬行链接、禁止快照:

 name="robots" content="index,follow,noarchive">

----------------------------------------------------------

 name="robots" content="noarchive">

以上的一段代码限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅限制一个搜索引擎建立快照的话,就可以像如下这样去写

 name="Baiduspider" content="noarchive">

需要注意的是,这样的标记仅仅是禁止搜索引擎为你的网站建立快照,如果你要禁止搜索引擎索引你的这个页面的话,请参照后面的办法。

第二种情况:禁止搜索引擎抓取本页面。

在SEO中,禁止搜索引擎抓取本页面或者是允许搜索引擎抓取本页面是经常会用到的。因此我们需要对这一部分重点做一次讨论。

为了让搜索引擎禁止抓取本页面,我们一般的做法是在页面的元标记中加入如下的代码:

 NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

在这里,META NAME="ROBOTS"是泛指所有的搜索引擎的,在这里我们也可以特指某个搜索引擎,例如META NAME="Googlebot"、META NAME="Baiduspide"等。content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。

INDEX  命令:告诉搜索引擎抓取这个页面

FOLLOW  命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。

NOINDEX  命令:告诉搜索引擎不允许抓取这个页面

NOFOLLOW 命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。

根据以上的命令,我们就有了一下的四种组合

 NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接
 NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接
 NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接
 NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接

这里需要注意的是,不可把两个对立的反义词写到一起,例如

 NAME="ROBOTS" CONTENT="INDEX,NOINDEX">

或者直接同时写上两句

 NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
 NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

这里有一个简便的写法,如果是

 NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

的形式的话,可以写成:

 NAME="ROBOTS" CONTENT="ALL">

如果是

 NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

的形式的话,可以写成:

 NAME="ROBOTS" CONTENT="NONE">

当然,我们也可以把禁止建立快照和对于搜索引擎的命令写到一个命令元标记中。从上面的文章中我们得知,禁止建立网页快照的命令是noarchive,那么我们就可以写成如下的形式:

 NAME="ROBOTS" CONTENT="INDEX,FOLLOW,noarchive">

如果是对于单独的某个搜索引擎不允许建立快照,例如百度,我们就可以写成:

 NAME="Baiduspider" CONTENT="INDEX,FOLLOW,noarchive">

如果在元标记中不屑关于蜘蛛的命令,那么默认的命令即为如下

 NAME="ROBOTS" CONTENT="INDEX,FOLLOW,archive">

因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。

在SEO中,对于蜘蛛的控制是非常重要的一部分内容,所以希望各位看官准确把握这部分的内容。

  • 没有任何评论
今日天气 ···

···

···

···

热门排行
用ASP实现网页BBS 2010-11-01
CSS cursor鼠标样式一览表 2012-06-25
.NET后台写JS代码 2011-11-03
网站地址多出jdfwkey的问题解析及... 2010-08-25
数据库xxx的日志已满,请备份该数... 2013-07-19
百度、google、Yahoo网站地图制作... 2011-01-30
<a>标签的伪类书写顺序问题... 2010-09-04
什么是长尾关键词? 2010-09-24
CEO名言 2010-08-31
Mysql 主从数据库同步 2010-09-12
博主推荐
本个人博客微信公众平台上线啦~~... 2013-10-13
饼哥网络互联上线啦~~要买域名空... 2013-09-20
网站title标题如何正确修改不会被... 2013-08-26
饼哥通讯录系统上线啦,欢迎大家... 2013-08-24
ASP .NET MYSQL 的简单分页 并不... 2013-08-19
网站有弹窗广告这样的站点,百度... 2013-08-17
做淘宝SEO优化需要注意的8大问题 2013-08-17
淘宝网怎么做SEO优化 2013-08-17
站长们要学习的“苍井空精神” 2013-08-17
苹果公司今日发布了iOS 7第五个开... 2013-08-07
随便看看
怎么看关键词优化得好不好? 2010-09-19
布尔型数据 2010-10-16
浅谈虚拟主机对网站排名的影响及... 2013-06-23
sql常用函数大全 2010-12-07
html中tabindex的作用 2010-09-12
ASP.NET上传文件 2010-09-08
flash快捷键大全 2010-09-09
遇到Javascript在IE6下window.lo... 2010-08-25
SQL快捷键大全 2010-09-09
ASP.NET控制Panel的隐藏与显示 2010-09-08
RSS新闻
传媒新闻
CSDN
八卦新闻
女性新闻
台湾新闻
互联网
军事-新浪博客
IT-新浪博客
汽车新闻
游戏新闻
国际新闻
国内新闻
体育新闻
我的微博
北京 上海 杭州 深圳 广州 成都