PR是 Pagerank的缩写, google IR理论是所有基于链接的搜索引理论中最有名的,.
PRR是 Google的始人之一拉里佩奇发明的,用于表示页面重要性的概念。用最简单的话说就是,反同链接越多的页面就是越重要的页面,因此PR值也就越高.
Google PR有点类似于科技文献中互相引用的概念,被其他文献引用较多的文献可能是比较重要的文献。
PR的概念和计算我们可以把互联网理解为由结点及链接组成的有向图,页面就是一个个结点,页面之的有向链接传递着页面的重要性。一个链接传递的PR值决定于导入链接所在页面的PR值,发出链接的页面本身PR值越高,所能传递出去的PR也越高。传递的PR数值也取决于页面上的导出链接数目。对于给定PR值的页面来说,假设能传递到下级页面100份PR,页面上有10个导出链接,每个链接能传递10份PR,页面上有20个导出链接的话,每个链接只能传递5份PR。所以一个页面的PR值取决于导入链接总数,发出链接页面的PR值,以及发出链接页面上的导出链接数目。
PR的两个比喻模型关于PR有两个著名的比喻。一个比喻是投票。链接就像民主投票一样,A页面链接到B页面,就意味着A页面对B页面投了一票,使得B页面的重要性提高。同时,A页面本身的PR值决定了A所能投出去的投票力,PR值越高的页面,投出的票也更重要在这个意义上,传统基于关键词匹配的算法是看页面自己说页面内容是什么,基于链接的PR则是看别人怎么评价一个页面第二个比喻是随机冲浪比喻。假设一个访问者从一个页面开始,不停地随机点击链接,访问下一个页面。有时候这个用户感到无聊了,不再点击链接,就随机跳到了另外一个网址,再次开始不停地向下点击。所谓PR值,也就是一个页面在这种随机冲浪访问中被访问到的概率。一个页面导入链接越多,被访问到的概率也越高,因此PR值也越高阻尼系数也与随机冲浪模型有关。