毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
C#众筹网络数据抓取系统的分析设计+源代码(3)
国内的百度、搜狐、新浪等就用的是类似国外的Inktomi 搜索引擎的技术,提供给包括LookSmart、Overtrure、HotBot、MSN 等在内的搜索引擎全文网页搜索的服务,但它本身并不直接面向用户。
1.2 网络数据抓取系统的分类网络数据抓取系统种类繁多,按照部署位置可分为:客户端:适合部署定主题的数据抓取系统(也叫聚焦爬虫)。实现一个可以与百度或者谷歌等竞争的综合性搜索引擎,其成功的机率是非常小的,但是比价服务、推荐引擎或者垂直搜索的机会便要多得多,比如提取商品价格信息、提取黄页信息或提取竞争对手的广告信息等, 种类数据抓取系统可部署非常多且具有侵略性,同时由于客户端 IP 地址为动态地址,很难被目标网站封锁,因此降低了大量部署的成本[8]。服务器侧:一般为多线程程序,可用 JAVA、PHP、PYTHON 等编写,具有同时下载多个目标HTML 的特点,一般的综合搜索引擎的数据抓取便是这么做的。然而,很可能会被对方封掉服务器 IP,由于服务器IP 不易更改,因此耗用宽带费用较贵。
共3页:
上一页
1
2
3
下一页
上一篇:
PHP+mysql自由行旅游网站的设计+源代码+答辩PPT
下一篇:
php+mysql大学众筹网站分析设计+源代码
数据挖掘在电子商务中的应用
数据挖掘的主题标绘数据获取技术与实现
基于PageRank算法的网络数据分析
基于神经网络的验证码识别算法
基于网络的通用试题库系...
网络常见故障的分类诊斷【2055字】
网络安全的研究【1797字】
安康汉江网讯
LiMn1-xFexPO4正极材料合成及充放电性能研究
老年2型糖尿病患者运动疗...
麦秸秆还田和沼液灌溉对...
网络语言“XX体”研究
张洁小说《无字》中的女性意识
我国风险投资的发展现状问题及对策分析
ASP.net+sqlserver企业设备管理系统设计与开发
新課改下小學语文洧效阅...
互联网教育”变革路径研究进展【7972字】