一个局外SEO人看360搜索 |
发布时间: 2012/9/19 9:36:03 |
最近国内搜索行业最大的事莫过于360搜索的推出,不少人在微博和博客留言里问我对360搜索有什么评论。作为一个以网络为生却无法感性体验国内互联网氛围的SEO,我其实对几个搜索引擎的厮杀、又有谁加入战局、各自使用了什么招数之类的事情不太关心,谁赢都没关系,谁赢了、谁占了一定市场份额,再去琢磨一下怎么在这个搜索引擎排名就行了,如此而已。
不过还是谈几点对360搜索的印象。
首先,目前360搜索的结果质量相当高,越是常用词,搜索质量越高,长尾词则质量下降。如果确如360自己所言,360搜索是他们自己的技术,那相当不容易。要知道,搜索引擎是个需要积累的、高技术含量的东西。这里说的积累,不仅是人才(这个倒可以短时间解决),还有算法的修改评测和数据的累积。尤其是数据的累积,这个几乎无法短时间弥补。如果360搜索在没有历史数据累积的情况下达到目前水平,那是相当惊人地牛X的。看看百度、Google之外的其它搜索引擎的质量就知道这有多难了,包括Bing,以微软在人才、资金上的投入,又做了那么多年的搜索,到现在也没怎么样。
不过呢,360搜索是否真的是他们自己的技术,我有高度疑问。除了上面说的难度问题,还有一些对排名结果的观察。根据我关注的一部分关键词的排名对比和历史记录数据,360搜索的结果很像百度结果最后排名调整前的数据,而且是一段时间以前的。
这里可能需要说明一下“最后排名调整”指的是什么。搜索引擎收到查询词,在数据库中按正常算法找到应该排前1000名(Google)或前760名(百度)的URL后,并不是马上直接显示出来,而是要在这1000个或760个结果中再最后调整一下排名,包括某些过滤算法的加入、这些URL之间链接关系的再计算等等。所以,我们有时候会在百度第76页看到一些很熟悉的、曾经风光过、现在被某种形式惩罚的网站。也不一定总是第76页,经常也出现在最后几页,比如seowhy.com的首页现在就在第75页。这些网站既然被降权或惩罚了,干脆找不到不是更合适嘛?为什么放到第76页去?原因很可能就是这是返回结果之后再最后调整的结果。
这种水平的高度相似,如果解释为巧合,或排名算法的相似,我比较难以相信。在数据量很大的情况下,算法的任何微小差异都将导致结果的明显差别。
而且,在360正式推出之前,好像没人听说过有什么360蜘蛛。这个姑且不说了,可以解释为匿名蜘蛛,虽然匿名爬行网站是相当不尊重站长的行为。
我当然不能肯定360结果就是,或者很大程度上是,百度最后调整前的数据。外人无法肯定。我只能说很像。
网上有人觉得360搜索是整合了百度和Google结果后再调整排名,我倒不觉得。整合其它搜索引擎数据的所谓“元搜索引擎”一直存在,如现在居然还活着的dogpile。不过360搜索能实时这么做的可能性很低,百度、Google怎么可能允许呢,360真这么做的话早就被屏蔽了(换IP也一样能屏蔽)。
那么360怎么会有百度的数据呢?真的建个关键词库然后去抓取百度搜索结果?怎么想怎么不可能啊,那太雷人了。百思不得其解,哪位知道指点我一下。又或者是我的幻觉?360真的完全是自己的技术?
本文出自:亿恩科技【www.enkj.com】 |