摘要运用Google搜索引擎时,Google会采用Page rank算法对网页按重要性进行排序。Page Rank算法的核心思想是根据网页的链接情况衡量它的重要性。本文主要介绍Page Rank算法,改进的Page Rank算法以及page rank算法在生活中的应用。71264
When using the Google search engine, Google will use the Page rank algorithm to sort pages by importance. The core idea of the algorithm Page Rank is to measure the importance the importance of pages by their link set. This paper describes the Page Rank algorithm, the improved algorithm and Page Rank algorithm in life.
毕业论文关键词: Page Rank定理;改进Page Rank定理;实际应用;排序问题
Keyword:Page Rank theorem; improved Page Rank theorem; Scheduling problem
目录
1. 引言 5
2. Page Rank算法的基本思想 6
3. Page Rank算法的具体介绍 7
3.1 Page Rank算法优点 9
3.2 Page Rank算法的缺点 9
4. 改进的Page Rank算法 10
5. 两种算法比较 11
6. 应用Page Rank算法的一个事例 12
6.1问题的模型 12
6.2 算例分析 13
5.3结论分析 14
7. 小结 15
8. Page Rank在其他方面的应用 15
1.引言
上世纪90年代早期网络兴起初期,每天有基数较大的含有特别行业内容的站点发布于网上。上网者无法通过筛选选择自身需要的内容,也没有办法找到域名或网址的站点。到了1993年,雅虎诞生了。雅虎的诞生为网民减轻了这样的烦恼。雅虎最初将每一个它所找到的网站,按照所属的分类目录进行划分组织,建立起一个整洁的、可以逐级查找的数据库。接着其他搜索引擎如Altavista ,Excite, Lycos等也相继为用户提供搜索工具。他们中的大多数是根据找到的元标识中的关键词来识别网站的相关性。看上去存在一定的合理性,但是当有人意识到可以在元标识中插入行业关键词或其他站点代码,就可以偷梁换柱的到搜索结果页面上的较高的位置的时候问题来了。很长一段时间,搜索引擎的结果被乱七八糟的垃圾网站搞的混乱,他们用某些相关的关键词充斥于网站的各个角落,用户实际需要的内容有效性很低。那些信用较高、地位重要的搜索引擎开始受到挑战,他们必须采取更好的措施精确的为用户输出搜索结果。Google意识到了传统搜索引擎所面临的这个问题。如果相关性由网管来控制的话,那么排名结果会被主观操控的大量关键词污染,从而降低了网页之间的相关性。其实网络的本质就是超链接。我们从这个逻辑上分析,每个人都让自己的网站与某些重要的站点相链接,那么本质上,这个站点就投了对方的一票。当上百上千个站点链接到这个站点时,我们合理地认为这个站点是一个很好的也是十分重要的站点就充分的表达了逻辑的合理性。就是在这样的逻辑推理下,Google的两位创始人Sergey Brin及Larry Page建立了一个搜索引擎算法公式,即将排名比重转移到了网页以外的因素上。他们的公式被命名为“Page Rank”(以创建人Larry Page的名字命名)。Google就是利用这一公式计算链接到某一网页的网站数量,然后按照从1-10分别给予表示重要度的分数。Google的创始人之一Larry Page于1998年提出了Page Rank,并应用在Google搜索引擎的检索结果排序上。