全网营销专家  为企业发展而生
   177 1407 7728

TrustRank算法详解


日期:2024-02-29    作者:攻硬营销


TrustRank是近年来比较受关注的基于链接关系的排名算法。 Trust Rank可以翻译为“信任指数”。TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。

TrustRank算法基于一个基本假设:好的网站很少会链接到坏的网站。反之则不成立,也就是说,坏的网站很少链接到好网站这句话并不成立。正相反,很多垃圾网站会链接到高权威、高信任指数的网站,试图提高自己的信任指数。

TrustRank算法示意图
 
TrustRank算法发明人还发表了一份专门的PDF文件说明 TrustRank算法的应用。感兴趣的读者可以在下面这个网址下载PDF文件
http://www.vldb.org/conf/2004/RS15P3.PDF
 
TrustRank算法基于一个基本假设:好的网站很少会链接到坏的网站。反之则不成立,也就是说,坏的网站很少链接到好网站这句话并不成立。正相反,很多垃圾网站会链接到高权威、高信任指数的网站,试图提高自己的信任指数。
 
基于这个假设,如果能挑选出可以百分之百信任的网站,这些网站的 TrustRanki评为最高,这些TrustRank最高的网站所链接到的网站信任指数稍微降低,但也会很高。
 
与此类似,第二层被信任的网站链接出去的第三层网站,信任度继续下降。由于种种原因,好的网站也不可避免地会链接到一些垃圾网站,不过离第一层网站点击距离越近,所传递的信任指数越高,离第一级网站点击距离越远,信任指数将依次下降。这样,通过 TrustRank算法,就能给所有网站计算出相应的信任指数,离第一层网站越远,成为垃圾网站的可能性就越大。
 
计算 TrustRank值首先要选择一批种子网站,然后人工查看网站,设定一个初始TrustRank值。挑选种子网站有两种方式:
 
一种是选择导出链接最多的网站,因为TrustRank算法就是计算指数随着导出链接的衰减。导出链接多的网站,在某种意义上可以理解为“逆向PR值”比较高。
 
另一种挑选种子网站的方法是选PR值高的网站,因为PR值越高,在搜索结果页面出现的概率就越大。这些网站才正是 TrustRank算法最关注的、需要调整排名的网站。那些PR值很低的页 TrustRank面,在没有算法时排名也很靠后,计算 TrustRank意义就不大了。
 
根据测算,挑选出两百个左右网站作为种子,就可以比较精确地计算出所有网站的TrustRank值。计算 TrustRank随链接关系减少的公式有两种方式。
 
一种是随链接次数衰减,也就是说如果第一层页面 TrustRank指数是100,第二层页面衰减为90,第三层衰减为80
 
第二种计算方法是按导出链接数目分配 TrustRank值,也就是说,如果一个页面的TrustRank值是100,页面上有5个导出链接,每个链接将传递20%的 TrustRank值,衰减和分配这两种计算方法通常综合使用,整体效果都是随着链接层次的增加, TrustRank值逐步降低。
 
得出网站和页面的 TrustRank值后,可以通过两种方式影响排名。
 
一种是把传统排名算法挑选出的相关页面,根据 TrustRank值比较,重新做排名调整。
 
另一种是设定一个最低的 TrustRank值门槛,只有超过这个门槛的页面,才被认为有足够的质量进入排名,低于门槛的页面将被认为是垃圾页面,从搜索结果中过滤出去。
 
虽然 TrustRank算法最初是作为检测垃圾的方法,但在现在的搜索引擎排名算法中,TrustRank概念使用更为广泛,常常影响大部分网站的整体排名。 TrustRank算法最初针对的是页面级别,现在在搜索引擎算法中, TrustRank值也通常表现在域名级别,整个域名的信任指数越高,整体排名能力就越强。
 
SEO培训服务