1、引擎:用来处理整个系统的数据流,触发新事务。

2、调度器:用来接受引擎发过来的请求,压入队列中,并在引擎再次请求时返回。

3、下载器:主要用来下载网页中的内容,并将其返回给蜘蛛。

4、蜘蛛:蜘蛛主要是来制订特定域名或网页的解析规则。

5、项目管道:负责处理由蜘蛛从网页中抽取的项目,主要任务是理清、验证和存储数据。当页面被蜘蛛解析后,将被发送到项目管道,并经过几个特定的次序处理数据。

6、中间件:主要有下载器中间件、蜘蛛中间件和调度中间件。[7

上一篇:Android移动校园助手的设计与实现
下一篇:MATLAB多旋翼飞行器的PID姿态控制系统设计

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

python基于决策树算法的球赛预测

网络常见故障的分类诊斷【2055字】

网络安全的研究【1797字】

网络信息安全技术管理的...

新課改下小學语文洧效阅...

网络语言“XX体”研究

老年2型糖尿病患者运动疗...

LiMn1-xFexPO4正极材料合成及充放电性能研究

安康汉江网讯

ASP.net+sqlserver企业设备管理系统设计与开发

我国风险投资的发展现状问题及对策分析

互联网教育”变革路径研究进展【7972字】

张洁小说《无字》中的女性意识

麦秸秆还田和沼液灌溉对...