1 绪论
1.1 研究背景及意义
互联网是一项重大的科技发明,它引发了全球性的变革,实现全球间的互联互通、信息的快速传播、包罗万象等特点,这些特点加速了全球信息化的进程,深度影响了政治、经济、军事、文化以及社会生活的各个领域。信息网络技术的高度发展伴随着我国互联网人数的快速膨胀,互联网不仅仅可以发布言论,还成为了信息交互、资源共享的平台和载体。而且因为搜索引擎的出现,人们面对互联网上海量的信息时不再感到不知所措。根据相关机构的调查:截止2011年6月,近80%的网民会登录搜索引擎,也就是说使用搜索引擎的人数将会达到4亿。
从消费者角度来讲,他们逐渐增强了对“企业身份”的关注。许多企业敏锐洞察到了这一趋势,于是自动把产品的更多信息传递给消费者,这样可以满足消费者良好的心理预期,且有效地塑造自身的企业形象,获得消费者的信任,从而会比对手在竞争上更有优势。Maria Yee的成功表明,企业可以通过自身身份信息的建立收获到消费者的认可,从而巩固在市场上的地位。对于投资者来讲,经济全球化不仅开始影响世界各国的经济发展,而且其“双刃剑”的作用越来越明显。
关键在于如何使用户能够简便快捷地获得全面的、最新的、正确的企业身份信息,开展企业身份信息的获取与分析研究已成为当务之急。
1.2 国内外企业信息资源分布现状
当下的开发者们都在改进传统的爬虫,其设计原理是,指向其他网站的链接都有可能依附在每一个网页之中,如果从一个链接开始跟踪,那么就有可能遍历整个网络里的网页。
尽管现在有很多开源的爬虫可供使用,但是很多企业仍是在开发适合自己使用的功能更加完善的爬虫,且用 Java 编写的爬虫也不少。
我们可以从企业的信息中获取很多内容,从中提取出有价值的部分,这部分信息能够对我们的生活产生很大的帮助。但是市场竞争压力过大,使得信息变得隐蔽、不完整,其中一个重要的问题需要解决,即如何快速准确地获取我们所需要的信息。
(1).搜索引擎:百度,谷歌,搜狗各大搜索引擎-企业网站、新闻报道、行业评论等等。优点:信息量大,覆盖面广泛。缺点是准确性,可参考性太低,需要经过多次的筛选,才能得到有价值的信息。
(2).权威数据库:可以参考国家或者国际上对各行各业有权威的分析作为的重点,能够获得最为有效的一手价值信息,从而对企业进行指导。优点是:内容具有权威性和准确性。缺点:不易取得。
(3).专业网站:很多是免费的。这些行业网站往往是各方面技术的专业网站各行业内部或者行业之间为了促进发展和交流而建立的。它具有很多优点:能够用更加专业的眼光看待这个行业,具有借鉴性,可用它对企业间进行对比。缺点:不包含深层次的信息。
综上所述,目前关于企业身份信息的获取尚未有一个完备的系统,用户无法方便快捷的获得某企业的综合性评价、官方信息、社会信息。
1.3 研究内容
基于jsp技术对企业身份信息获取和分析系统进行分析,本文对以下内容进行研究:
(1)开发技术研究
Jsp技术、Eclipse工具、Tomcat中间件、Mysql数据库。
(2)需求分析和系统设计
1.4 研究方法和步骤
本次课题采用了快速原型与文献研究相结合的方法[1]。采用以下步骤: