2022年5月7日星期六

nofollow的定义及如何正确实用nofollow? |林子超博客


nofollow的定义及如何正确实用nofollow?

什么是nofollow:

  在html标签中,< a > 标签的rel 属性被用于说明当前文档与被链接文档的关系。而nofollow则是其中的一种属性值,其用法示例为:

  < a href="..." rel="nofollow" >...< /a >

  其另一种使用方法,也是最原始的使用方法,是用于网页的元标签中,告诉搜索引擎不要抓取那个网页上的所有导出链接。其书写方式为:

  < meta name="robots" content="nofollow" / >

  关于meta robots的常见属性值还有noindex与noarchive等,此文不延伸出去了。

  除此之外,可以达到类似效果的,还有常见的robots.txt,以及被Google所支持的X-Robots标签。

  一般更常用的是第一种,因为它具有最大的灵活性。本文主要以< a >标签中的nofollow展开讨论。

nofollow的原意:

  最初nofollow属性值诞生的时候,是为了改善spam的情况的。它告诉搜索引擎不要给所链接向的页面传递权值,这样被链接的页面理论上就不会得到任何好处。因此,nofollow多数情况下被使用在博客留言等地方,这也是多数人对于nofollow的主要认识。

  但因为nofollow的这种作用,有人在友情链接上面使用nofollow从而企图控制PR,其实这样的想法是完全错误的,PageRank不存在流失一说。虽然基于原始PR公式,网页上的导出链接过多并不会好,但Google更是大力推崇连向好的网站的。

  也有人会选择去掉博客评论上面的nofollow,这也是不明智的,因为博客留言中往往会有着各式不相关的网站链接出现,这会导致网站主题漂移的情况。但因为不属于本文的范围,不再展开。

  因为很多人滥用了nofollow,所以Google一般的建议是,只对于不可控制的回复链接以及付费的广告链接使用nofollow。这也就是其最原始的本意。

  由于后文涉及一些具体情况,先描述下主要的两个搜索引擎对于nofollow的不同态度。

Google对nofollow的处理:

  根据Google网站站长工具帮助里面所提,Google 不会传递nofollow链接的PR或定位文字(即锚文本),它会选择完全放弃对于这些链接的追踪。但是另外需要注意的是,如果有其他未使用nofollow的链接连向某些页面时,那些页面依然会被置入索引。

百度对nofollow的处理:

  根据Lee所说的,百度对其处理方式有些值得玩味,直接贴出原文:

  < meta name="robots" content="nofollow" > 不追踪链接,不传递权重。
  < a rel="nofollow" href="#" >123< /a >只起到发现链接的作用,但不传递权重。
  从站长的角度,应该看不到任何不同。。。

  言下之意就是,< a >标签的nofollow依然是会发现链接的,既代表着会抓取。而“权重”在这里是广义权重(涉及PR、锚文本等等),还是比较狭义的权重(仅仅是PR之类)呢?Lee没有提及。

  根据个人的实验,用了一个nofollow的链接指向了Google,过了一段时间,加上引号搜索那个链接的锚文本,Google排在了第一位。可以料到的是,很有可能百度上面的nofollow不传递的只是基于链接的狭义权重。但也不能完全排除的可能性是,百度根本不支持nofollow(或不支持external nofollow)。

External nofollow的含义:

  external这个前缀只是在html语义上的差别,对于SEO没有半点影响。它的本意是,屏蔽的是外部链接。尽管external nofollow和nofollow看上去略有区别,但搜索引擎应当是完全相同的去看待它们的。百度唯独不支持前者的可能性较小。但万一是的话,只能说百度这点上做得非常不足。

nofollow对于辅佐爬虫抓取的运用:

  我们知道的是,搜索引擎判断网页的重要性之中,占了很大比例的一点是网页被引用的数量。当一个页面被链接的更多,通常它就显得更重要,随之爬虫也会经常去抓取这些页面——尽管往往是不需要的,因为很多页面是无价值页面,比如很多网站都有的“联系我们”等等。

  这样来说,网站上面往往就有一些无价值页面被频繁抓取,总而降低了真正有价值的页面被抓取并置入索引的几率。所以对于网站上的无价值页面采取nofollow的手段,是对于提升收录量有着很大的积极意义的。

PR Sculpting:

  这是基于一般的nofollow用法所进化出来的极端优化方法,属于黑帽范畴。它大幅度的屏蔽链接——无论页面是否有价值。它利用的是PageRank算法的弊端,通过减少各个页面上的链接数量,从而在短时间内把网站中个别页面的PR提升到一个很高的数值。因为这种黑帽nofollow技巧的滥用,于是Google做出了动作。

Google的nofollow权值分配方法变更:

  因为PR Scupting严重影响了搜索引擎结果的公正性,Google对此做出了变动。举最简单的例子:

  最早什么都没有的时候,一个页面上有10个链接,假设该页面有10分,就各送1分给那10个被链接的页面。 nofollow刚出现的时候,其他假设依旧,但是nofollow了其中5个链接,那么被屏蔽的页面不会得到任何分值,没屏蔽的每个可以得到2分。 nofollow权值分配方法改变后,只要页面上有10个链接,不管几个被nofollow,每个页面都最多得到1分,当然被屏蔽的依旧是0。 因为此时PR Sculpting在国外十分盛行,很多网站上或多或少会些其影子,于是Google此举引起了很大反应。

使用nofollow做主题归类:

  如果稍微研究过一些算法就会知道,基于链接的算法存在着主题漂移这一难题,尤其是HITS算法,一旦搜索引擎把握不好,就没法正确判断网页的主题为何,防止主题漂移的一个简单的方法就是利用nofollow。

  搜索引擎是一向强调主题归类的,比如百度SEO指南里面提到的,网站的内页应该连向其上级栏目页(不包含其他不相关栏目)等等,所以用nofollow做主题归类完全是属于白帽的,是帮助搜索引擎更好的理解网站的内容。

  其做法就是当某页面上连向不相关的页面时,使用nofollow,更形象的比喻,主题归类就是像在整理抽屉一样,把相关的东西尽量放到一块,整齐明了。

  但也不能为了主题归类,将不相关的链接全部分隔开来,毕竟搜索引擎还是需要一些其他的链接来发现内容的。

nofollow与robots的区别:

  很多时候nofollow和robots一并被人提起,因为一般看来都有一个效果——让搜索引擎不要抓取某个页面。这里因为多种搜索引擎的不同处理方式是有不同情况的:

  百度:按照上文所述,百度爬虫极有可能会爬行nofollow链接,所以试图用nofollow来屏蔽某个页面不被抓取是不妥当的,必须辅以robots文件。而robots文件已经屏蔽的页面,按照Lee的暗示,是不会获得权重的。

  Google:Google爬虫不会爬行nofollow链接,但是只要页面有一个dofollow链接,依然是有可能被抓取的,想要屏蔽页面最妥当的方式还是采用robots文件。而根据有人的vgsa测试,仅仅robots屏蔽的页面依然会在Google上面获得PageRank。

  因为不同搜索引擎对待这两个东西的方式不尽相同,所以当需要屏蔽页面的时候,应当把这两个都用上。

  Nofollow表现是一个用于指示站内某些超链接不是经过站长推荐的,这个链接不是一个信任票,不应影响搜索引擎索链接投票的HTML属性值。搜索引擎看到这个标签就会减少或取消此外链的投票权重。目的是尽量减少无用链接对网站在搜索引擎中的影响。

  百度官方已明确表示:“百度现在支持nofollow标签。带nofollow标签的链接,我们会忽略掉它绝大部分的作用。”肯定了百度与谷歌两大主流搜索引擎都支持nofollow标签。nofollow标签的作用大家现在都知道了,那么我们平常网站建设中,如何正确使用nofollow标签呢?

  1、交互功能

  如:博客评论、网站留言板等所有访客留下的链接,这些链接不是作为网站管理员的你愿意添加的,是不受控制的链接,不代表站长赞同的导出链接,这个时候我们把这些链接都标记nofollow属性。根据谷歌pr值投票理论,假设每个页面的pr是一定的,每一个链接都代表一个投票,当你的导出链接越多,你站内网页的pr等级和网页权重被稀释的也就多。加上nofollow属性标签后,百度,Google会忽略掉这个链接的投票作用,挽回网站权重被稀释的影响。

  2、广告链接

  广告链接的作用是为了在本站宣传产品,目的是让我们网站的用户浏览广告进入对方网站,但链接权重的传递并不是管理员愿意的。很多新手站长不理解理解nofollow表现的作用,把广告链接写在js里或者iframe调用,大家都知道过多的JS与iframe嵌套,对搜索引擎是非常不友好的表现,很多网页木马升序都是iframe嵌套在网页中,百度甚至是讨厌这样的代码,这就完全背离seo的原理和网站优化的初衷。最简单的做法就是在链接上加上nofollow标签。

  大家可以见一个例子,站长工具( http://tool.baiwanzhan.com )首页导出链接多达100多个,但是为什么它的网页PR值是4,而且搜索引擎权重丝毫没有降低呢?通过查看源文件,所有广告链接全部都有nofollow属性标签,所以没有稀释网页本身的权重。

  3、内页链接控制权重传递

  这一点很容易被管理员所忽略。同一个网站的每一个页面的作用和权重都是不一样的,通常首页权重最高。首页上的链接往往都是最多的,但是有一些类似“注册”“登陆”等等链接,这些链接必须出现,但对整个网站的seo没有任何作用,那么这样的链接我们就可以加上nofollow标签,使整个网站的权重将不会传递到这种无用的页面上。譬如,我们的很多关键词都体现在各个频道中或者文章页面,更高的权重将会传递到这些页面上。

  seo是一个方方面面都要照顾到的系统工作,不要忽略每一个提高权重的细节。大家以后交换友情链接的时候,也要注意一下对方是不是存在加Nofollow属性的链接欺骗行为。今天补习了一下“如何正确使用nofollow标签”,希望能给大家带来帮助!

写在最后:

  nofollow是一个对于SEO很有作用的属性值,但是也同样是比较容易被滥用的。而如何真正用好它发挥应有的价值,需要其他方面更多的基础积累。

  个人所知的主要就是这点,虽然还有些其他的运用方式略了解些,但是自己还很模糊,也就不多提了。除此之外,nofollow应当还有不少运用方式,是个绝对值得发掘的属性值。

  如果你有什么已知的运用方式,或者看了此文之后一段时间后自己延伸出了什么,欢迎在此留言交流。

没有评论:

发表评论

注意:只有此博客的成员才能发布评论。

Also Read: