相关, 算法, 以及, 谷歌, pr值
基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T)/C(T)其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。 PR(A)=(1-d) d(PR(t1)/C(t1) … PR(tn)/C(tn));A代表页面A;PR(A)则代表页面A的PR值;d为阻尼指数。通常认为d=0.85;t1…tn代表链接向页面A的页面t1到tn;C代表页面上的外链接数目。C(t1)即为页面t1上的外链接数目。 从计算公式可以看到,计算PR值必须使用迭代计算才能得到。优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。 网页 , PR值 , 谷歌 , 算法 |
网站建设,对于收藏夹是个很值得你去花时间研究的问题