Google TrustRank与Hilltop算法 |
发布时间: 2012/9/15 14:45:48 |
由于搜索引擎在计算网页排名的时候,非常依赖超链接,而且连接的质量越来越显得重要。这种情况,需要对链接的来源站点质量进行判断。更重要的是,以前依靠连接和相关性来决定排名的方式,已遭到了各种各样作弊行为的挑衅,Spam的横行,直接导致了Google必须找到一种新的反作弊机制,以确保高质量的站点来获得搜索引擎的亲徕。这种情况下Sandbox和TrustRank被提了出来。意图确保好的站点能获得更高的搜索表现,并加强对站点的审核。Google自己关于TrustRank的最初论述也提到了这些.
TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。TrustRank算法发明人还发表了一份专门的PDF文件,说明TrustRank算法的应用。
PageRank不是决定页面相关性的唯一因素。在这篇文章里,我们讨论两个众所周知的算法,即Hilltop算法及TrustRank(信任级别)。
(1) Google TrustRank
我们采用半自动的方法从垃圾文件中筛选出质量较高的文件。首先,我们依靠一个专家去评估出一系列的”种子”页面。只要我们手工去识别这些受到好评的”种子”页面后,利用链接结构,我们就可以去寻找其他质量可能不错的页面。
总结一下TrustRank的工作原理:我们先人工去识别一个高质量的页面(或称其为”种子”页面),那么在”种子”页面上存在链接指向的页面也有可能是高质量的页面。得到”种子”页面链接的页面,其TrustRank就越高,与”种子”页面链接深度越大的页面,其TrustRank自然就会慢慢降低(关于链接深度,请查看《SEO教程:搜索引擎优化入门与提高》中的“链接策略”一章)。
一旦”种子”页面确定下来,那么就很容易从高质量页面中筛选中垃圾页面。基于TrustRank的逻辑大概是这样的:
1. 高质量页面一般都不链接至垃圾页面;
2. TrustRank值会随着页面的过渡而逐渐降低,即某一页面与”种子”页面的链接深度越大,那么TrustRank值就会越低;
3. 最权威的网页就是”种子”页面本身。
例如:常见的”种子”页面包括DMOZ,Yahoo目录等。有人曾把TrustRank比喻为高质量页面的许可证。
(2) 关于“Google TrustRank与Hilltop 算法”的一些有趣的观点:
1. 链接权重继承因素;
2. 人工评估认为权威的页面将获得更高的权重。
TrustRank是由Google后来的员工提出来的,低质量的分类目录对于提高页面的排名依然有好处,但正如SEO专家们已经呼吁多年的,低质量的分类目录的影响力正在慢慢消失。为了保持排名的稳定,我们必须指出如何去得到”种子”(权威)页面的反向链接。
Aaron Wall 在很久前就提出:“我们最好把互联网看到是一个巨大的社会网络”。这种观点到目前还被认为是正确的。链接体现出了人们之间的关键字,但是最好的链接是不能购买的- 正如我们在现实中是购买不了友谊的。
我们在进行搜索引擎优化时,如何去利用TrustRank呢?
如果你所处的是一个具有竞争的行业,那么Google极有可能利用TrustRank去决定”种子”页面以及过滤掉商业垃圾页面。这个关键就在于我们如何去识别”种子”页面(”种子”网站),然后从他们上面得到反向链接。
在评估潜在链接伙伴时,我们最重要的是选择“种子”页面或者与种子页面存在链接关系的页面。怎样去识别这些页面呢?主要有几种方法,例如:这些页面上的信息对于用户来说是否有价值;权重高不高;域名开通及被收录的时间有多长。
最后一点非常重要,新的商业网站不大可能会成为“种子”网站,因为旧域名所指向的网站通常是其行业的创始者,他们通常为行业带来巨大的改变,这些网站中往往会存在一些种子网站或者种子页面。
本文出自:亿恩科技【www.enkj.com】 |