毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
Python基于hadoop的大规模并行数据分析系统原型设计(11)
def __init__(self):
wx.Frame.__init__(self, parent=None, -1,””)
row = 3
col = 3
hgap = 3
vgap = 3
sizer = wx.GridSizer(row, col, hgap, vgap)
for label in labels:
frameWin = FrameWin(self, label=label)
sizer.Add(frameWin, 0, 0)
self.SetSizer(sizer)
事件驱动编程
事件驱动程序是一种控制结构,它接受事件,并响应他们。WxPython的结构和一般的Python脚本不同。事件驱动系统的主循环如同死循环一般,一直在等待事件的发生,一旦事件后,系统开始响应这个过程,然后将足够的资源分派给这个事件,结束后继续等待下一个事件。在初始化之后,执行mainloop()后,程序就进入一个空闲的循环,等待用户的交互,直到退出这个循环。
图4-4 WxPython事件处理过程图
从上述处理过程图中可以将处理过程分为四大步骤:
发生事件
解析事件并进行触发前的策略
响应事件并找到响应对象
判断是否继续处理、判断是否Skip
在时间流程中含有Skip事件可以进行其他流程的相应事件。在程序设计中有大量的
事件必须进行Skip处理如:鼠标按下事件以及按钮单击事件。在执行完第三个步骤后如果有Skip,则继续响应Skip中的事件,课题中常用validate函数先进行判断相关操作是否正常:
def OnMouseDown(self, event):
validate()
event.Skip()
多线程的WxPython
在图形界面程序中,在应用程序后台可能长期执行一个处理过程而不会影响用户其他的操作,对用户的体验非常有好处,因此允许后台产生一个线程并在线程中长期处理是必须的。
使用WxPython的全局函数CallAfter(),该函数可以传递消息给主线程,使得主线程在当前事件处理结束后可以对不同的线程调用函数。值得注意的是该函数总是在主线程中执行。使用Python的threading模块,在线程结束时使用threadfinisher()。本课题使用队列对象来管理线程的通信,为线程通信设置了一个并行的队列,当工作线程增加一个命令对象到队列时会调用wakeupidle()确保存在空闲事件。这个机制保证了后台线程间的通信,并且图形界面的处理扔在主线程中。
Hadoop关键技术
MapReduce编程
Hadoop通过把作业分成若干个小任务来工作,其中包括两种类型的任务:map任务和reduce任务。有两种类型的结点控制作业的执行:jobtracker和tasktracker。Jobtracker通过调度任务在tasktracker上运行,协调系统上所有的作业。而map任务是作为中间输出,将处理结果写入本地的硬盘,然后当做reduce的输入。一旦作业完成,map的输出便可以删除。Reduce则是将有序的map输出进行合并,进行自定义的reduce函数,然后输出到hdfs中。
图4-5简单的MapReduce示意图
在Mrjob框架下,并结合数据挖掘系统设计,进行MapReduce操作只需要完成如下代码的详细实现:
共11页:
上一页
1
2
3
4
5
6
7
8
9
10
11
下一页
上一篇:
ASP+access社区爱心网建设+流程图+ER图
下一篇:
GTK+OpenSSL数字签名算法设计及实现
基于Apriori算法的电影推荐
基于PageRank算法的网络数据分析
基于神经网络的验证码识别算法
基于网络的通用试题库系...
python基于决策树算法的球赛预测
基于消费者个性特征的化...
基于网络的通用试题库系统的整体规划与设计
10万元能开儿童乐园吗,我...
医院财务风险因素分析及管理措施【2367字】
国内外图像分割技术研究现状
神经外科重症监护病房患...
中国学术生态细节考察《...
C#学校科研管理系统的设计
志愿者活动的调查问卷表
AT89C52单片机的超声波测距...
承德市事业单位档案管理...
公寓空调设计任务书