robots, 影响, 排名, 排名优化, 名优
Robots的影响与排名优化的关系让咱们先来认识下什么是Robots Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站站点通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。一、影响Robots协议是网站站点出于安全和隐私考虑,防止搜索引擎抓取敏感信息而设置的。搜索引擎的原理是通过一种爬虫spider网站程序,自动搜集互联网上的网页并获取相关信息。而鉴于安全与隐私的考虑,每个网站站点都会设置自己的Robots协议,来明示搜索引擎,哪些内容是愿意和允许被搜索引擎收录的,哪些则不允许。搜索引擎则会按照Robots协议给予的权限进行抓取。Robots协议代表了一种契约精神,互联网企业只有遵守这一规则,才能保证网站站点及用户的隐私数据不被侵犯。违背Robots协议将带来巨大安全隐忧——此前,曾经发生过这样一个真实的案例:国内某公司员工郭某给别人发了封求职的电子邮件,该Email存储在某邮件服务公司的网站站点的服务器上。因为该网站站点没有设置robots协议,导致该Email被搜索引擎抓取并被网民搜索到,为郭某的工作生活带来极大困扰。如今,在中国国内互联网行业,正规的大型企业也都将Robots协议当做一项行业标准,国内使用Robots协议最典型的案例,就是淘宝网拒绝百度搜索、京东拒绝一淘搜索。不过,绝大多数中小网站站点都需要依靠搜索引擎来增加流量,因此通常并不排斥搜索引擎,也很少使用Robots协议。北京市汉卓律师事务所首席律师赵虎表示,Robots协议是维护互联网世界隐私安全的重要规则。如果这种规则被破坏,对整个行业就是灭顶之灾。二、与搜索引擎优化的关系百度对robots.txt是有反应的,但比较慢,在减少禁止目录抓取的同时也减少了正常目录的抓取。原因应该是入口减少了,正常目录收录需要后面再慢慢增加。Google对robots.txt反应很到位,禁止目录马上消失了,部分正常目录收录马上上升了。/comment/目录收录也下降了,还是受到了一些老目标减少的影响。搜狗抓取呈现普遍增加的均势,部分禁止目录收录下降了。总结一下:Google似乎最懂站长的意思,百度等其它搜索引擎只是被动的受入口数量影响了。本文由zjyksf.com/productInfo.php?pid=523&oid=0整理,转载请注明出处! |
站长百科(12月19日)推荐条目:YourphpCMS