百度快照、Baiduspider、Googlebot |
发布时间: 2012/9/22 15:14:50 |
百度快照,百科上给予的解释是,每一个被百度收录的网页,都会在百度服务器上面存一个备份,这里
要说明一下的是这个备份是纯文本备份,不包含图片、flash以及视频文件之类的。所以说,如果你在搜
索结果页面点击百度快照后能够看到的一些图片等等的非文本类的东西,这证明你的网站是处于正常状
态下的。如果你的网站已经关闭,这时候快照中是不会显示网页里面的图片的。也就是说,快照里面的
图片类信息是调用原网页的。
对于一个网站的百度快照更新时间来说,具体的讲就是这个网站在搜索结果里出现的时间。一般说
来,大部分搜索引擎良好的网站的快照时间都是前一天的,就比如说今天4月25日,快照的时间就是4月
24日。除了这个情况,百度快照的更新时间也有三天之内的,一星期内的,甚至一个月乃至多年的都有
。这个百度快照的更新时间为什么会出现这样的情况呢,这就要引出baiduspider这个概念了。
Baiduspider,即百度蜘蛛。它是百度搜索引擎的一个自动程序。它是百度搜索引擎的一个自动程
序。它的作用是访问互联网上的被允许的网页、图片、视频等内容然后再在百度服务器上面建立索引数
据库,使用户能在百度搜索引擎中搜索到这些网页、图片、视频等内容。
而百度快照在搜索引擎中出现的时间问题,与baiduspider的抓取有着很大的关系,进一步说更与
我们网站自身有着绝对的关联的。其实这样说也不太准确,毕竟一个网站所牵扯到的东西太多,很多很
多都不是独立存在的。关于百度蜘蛛,或许会有人说,如果我的网站不想被蜘蛛抓取怎么办?这个问题
的话,要解决也十分的简单,需要建立“robots.txt”文件,然后写上禁止搜索引擎抓取的代码即可。
而讲到了百度搜索引擎的baiduspider,自然我们大家也会想到谷歌搜索引擎Googlebot。
Googlebot,也叫谷歌机器人,是Google 的web 抓取漫游器。它从web上收集文档,为Google搜索引
擎建立可供用户搜索的索引。其实到这里,大家可以想到,googlebot与baiduspider从物理意义上面讲
是一个意思,都是来抓取网站的机器。所以,对于googlebot就不再多讲了。
本文出自:亿恩科技【www.enkj.com】 |