摘要随着时代的进步,世界迈入了一个信息爆炸的时代,人们无时无刻的不在接收着各式各样的信息。而其中,互联网的扩张使得网络成为人们获得信息的一个主要途径,由此也带来了大量的网络数据,因而,搜索引擎的搜索性能成了许多人对信息获取速度的主要考量。仅仅只靠数据库提供的搜索方法,已经不满足于现今人们的要求。Apache软件基金会提供了一个优秀的项目——Lucene,对于搜索的应用上有很大的贡献,它是一个良好的全文搜索引擎架构,开源的它使得开发人员更加容易对它进行应用和改造。46326
本文主要通过研究与分析Lucene插件及其工作机制,设计与实现了一个基于Lucene的站内搜索引擎,当新闻内容发布时,能够利用Lucene完成分词,生成内容索引,当用户搜索时能够利用已有的索引快速的定位搜索内容,可适用于当今许多内容管理系统,在用户搜索内容时提供了良好的搜索速率。同时,本文还通过对比基于SQL的站内搜索,比较两种方式的速率差异。 毕业论文关键词:搜索引擎;Lucene;站内搜索;内容管理系统
ABSTRACT With the progress of the times, the world has entered an era of information explosion, people not receive all kinds of information at all times.Of which, the expansion of the Internet network to become a major means of access to information, which also brought large amounts of network data, so search engines search performance into many people access to information the main considerations.Only by database search methods, does not meet the requirements of today.Apache Software Foundation projects provides an excellent--Lucene, application for search has a great contribution, it is a good full-text search architecture, it makes it easier to developers of open source applications and modifications to it.
Paper main through research and analysis Lucene plug-in and work mechanism, design and achieved has a based on Lucene of station within search engine, dang news content released Shi, can using Lucene completed participle, generated content index, dang user search Shi can using has some index fast of positioning search content, can applies Yu today many content management system, in user search content Shi provides has good of search rate.Meanwhile, by comparing the SQL-based search, comparing rates in two ways.
Keywords:Search Engine;Lucene; Station Within Search;Content Management System
目 录
第一章 绪论 1
1.1 基于Lucene的站内搜索引擎的背景 1
1.2 基于Lucene的站内搜索引擎的目的与意义 1
1.2.1 基于Lucene的站内搜索引擎的目的 1
1.2.2 基于Lucene的站内搜索引擎的意义 1
1.2.3 基于Lucene的站内搜索引擎的研究方法 1
第二章 开发环境、语言和相关技术介绍 3
2.1 .NET开发平台介绍 3
2.2 SQL Server数据库 3
2.3 Lucene技术介绍 4
2.4 盘古分词介绍 4
第三章 Lucene.NET组件的安装部署与分析 6
3.1 Lucene.NET组件的安装部署 6
3.2 Lucene.NET的总体框架 9
3.2.1 Lucene.NET的执行流程 9
3.2.2 Lucene.NET各模块功能 9
3.3 全文检索的基本原理 10
3.3.1 全文检索的含义 10
3.3.2 索引的创建 11
3.3.3 搜索索引 12
第四章 实现过程 13
4.1 数据库设计 13
4.2 具体实现代码 13
4.2.1 索引的创建 13