大数据背景下高校信息资源共享库建设探究
[中图分类号]G[文献标识码]A
[文章编号]0450-9889(2017)05C-0006-03
高校信息资源共享是信息技术与现代管理理念的融合。大数据背景下,信息资源共享的本质是通过借助于网络工具,实现以用户为中心论文网,以用户利用为目标,整合高校信息资源,实现高校信息资源的可获知性和获取性,促成社会组织与公众平等拥有高校信息资源的获取权和获取条件,最终实现高校信息资源的价值最大化。在大数据信息技术越来越成熟的背景下,高校信息资源共享不但是社会进步的表现,同时承载着多项使命和义务。当高校信息资源共享已经成为共识,大数据背景下的信息资源共享库建设意义重大。
一。大数据相关技术
(一)关于大数据
大数据处理模式上可以分为流处理模式和批处理模式。流处理模式也就是直接处理数据的模式。其理念是随着时间的流逝数据价值在不断减少,因此快速处理最新数据,可以使数据分析结果更具价值性。经常用于诸如网页点击数量的实时统计。传感器网络。金融中的高频交易等,将源源不断的数据组成数据流,随时有数据到来随时处理。批处理模式是先存储后处理。这是Google公司于2004年提出的数据处理模式。其运行原理是首先将用户原始数据分块,通过交由不同任务区处理的方式,解析出数据集合,再依据用户自定义条件基础上获得中间结果,将结果写入本地硬盘。然后从硬盘读取数据进行排序,具有相同值的数据组织在一起,并应用户自定义函数影响排序结果最终输出数据处理成果。
无论是流处理模式还是批处理模式,针对大数据应用类型广泛这一现状,为了使数据的处理更具有效性和实时性,两种数据处理模式经常被交互使用。比如一些社交网站由于数据量庞大,因此针对大数据处理区别为在线。近线和离线。处理过程中在线处理往往是毫秒级或者是秒级,采用流处理模式较为合理。离线的数据处理时间往往以天为单位,所以采用批处理较为合理。两种方式的交替使用,可以最大限度地利用系统IPO。而近线的大数据处理一般是以小时为单位来划分,因此,依据数据处理结果需要既可以采用流处理也可以采用批处理。
(二)大数据时代高校信息资源共享库的服务模式与特点
大数据时代高校信息资源共享库的服务模式一般可划分为校内共享模式。校际共享模式和社会共享模式。
校内共享模式是高校信息资源基本的共享模式,也是大数据条件下最容易实现的共享模式。其主要特点,一是通过网络通信专业人士搭建校内信息资源共享平台,通过高校各个部门的组织状况。地理布局和楼层结构。信息资源来源等情况,构建信息资源共享的计算机基础设施。二是校内信息资源共享是通过局域网实现,只要满足通信设备。通信线路和相应的网络软件要求,做到终端。多台计算机及其附属设备的连接,就能够实现校内信息资源的共享。三是校内信息资源共享的优势是独立使用网络资源可以保证属于秘密性质的网络资源不被盗用,在物理隔离的保障下,实现了最大程度的数据安全。同时,还具有局域网内数据传误码率低。共享安全性高等特点。
校际共享模式是高校之间的信息资源共享模式。比如同一区域内高校之间建立共享库或者是同一类高校间建立共享库。以当前的校际共享模式来看,一般是通过省级教育主管机关的电子政务网作为平台实现校际共享。这一共享模式的特点表现为,首先,实现省级教育主管机构的政务网系统工程。通过高校与省级教育主管机构的政务网系统工程的整合,形成高校信息资源共享库。其次,共享库建设必须实现同一的数据标准,也就是通过建立统一的元数据标准。元数据主持系统。元数据仓储和利用协议标准等措施,实现用户的无障碍信息资源访问。再次,高校之间的数据共享理念必须一致。因为,一旦各个高校为了巩固自身利益,妨碍共享库的建设,在诸多校际信息资源共享库建设模式上会存在较大的差异,所以必须统一高校信息资源共享理念。最后,针对用户应用层面服务界面统一。检索方法统一等。
社会共享模式是指高校以互联网为基础,以高校专业网站为节点,利用网络技术突破时空。地域的限制,向不同高校信息资源用户提供共享服务。该模式的特点首先表现为社会部门与组织间的协作关系。比如档案信息资源社会共享必须要求档案学会。协会。学会等档案机构参加,在组织上相互互联,构成档案信息系统的网络节点服务系统。其次是高校信息资源共享网站集群系统的建设。因为单一的网站无论其功能还是信息资源量都是有限的,因此,需要整合高校信息资源做到网站全方位联通的模式,使用户信息资源使用中实现和高校任何信息资源的互动与沟通。
二。大数据背景下高校加强资源共享库建设的必要性
大数据从字面意思来讲就是海量数据。这些海量数据是通过当前的网络技术条件获取。博客。社交网络或者是位置的服务LBS为代表的新型信息发布方式等,借助于云计算。物联网等技术为大数据提供了取之不尽的数据源,并且海量数据仍在不断的增长和累积当中,大数据时代已经来临。从计算机起源到计算机技术不断发展的过程,我们非常熟悉数据库的概念。如果从表面的技术演进来看,数据库的发展必然向大数据时代演进。但是两者却存在着本质的管理区别。
首先,数据规模的本质差异。从数据库处理的基本单位来看一般以Mb为单位,而大数据时代则往往以GB。TB甚至是PB为单位,量变引发数据管理的质变成为必然发生的现象。
其次,数据类型的差异。传统数据库种类往往比较单一,以高校最早的信息资源共享为例,仅仅是图书馆之间的馆际合作。大数据时代则包含了人才库。图书馆数据库。网络信息资源数据库等的合作,数据种类之繁多是数据库远远不能比拟的。数据库以结构化数据为主,大?稻菰虬?含着结构化数据。半结构化数据以及非结构化数据,同时,占据主要发展模式的半结构化数据和非结构化数据比重越来越大。再次,模式和数据的关系发生了改变。传统数据库受限于其技术条件,是先有模式后有数据。大数据条件下,数据模式难以在数据产生之前确定,只有数据产生后才出现相应的模式。尽管出现了大数据条件的数据模式,随着数据量的不断增长,其模式形态或者是结构也处在不断变化之中。
最后,处理工具出现本质性变化。数据库的处理工具通过一种或几种工具,即所谓的Onesizefitsal就可以实现数据处理。但大数据却需要通过数据思维模式的转变实现新的处理方式。这也就是著名数据库专家JimGray博士所提出的第四种数据处理范式即第四范式“。其本质是改变传统以计算机为中心的模式,转变为数据思维模式,即以数据处理为中心的大数据模式。
三。大数据背景下高校加强信息资源共享库建设的具体措施
(一)构建信息化基?A设施建设
高校进行大数据数字图书馆数据的共享,在当前来看,并没有固定的模式或较为成功的典范可资借鉴。但数据共享的理念已经成为高校间馆际合作的普遍理念。借助于信息技术和互联网技术高速发展的数据共享环境的有利性,高校间数据库共享的实现条件已经具备。既然没有统一的。规范的和可资借鉴的具体模式,高校完全可以依托于本馆用户的需求,针对本馆的不足,寻求其他高校数字图书馆展开先期的合作和共享。以此为基础,在原有馆藏资料的基础上,构建信息化基础设施建设,满足用户更为多样化和个性化的需求。在高校高层领导间沟通的层面上,建立馆际合作的统一管理的领导机构,并制定馆际合作目标的统一规划和发展策略。在互惠互利。资源共享原则的指导下,履行各个图书馆的职责。
(二)采用协同化服务模式建立完善的运行机制
传统图书馆提供服务的模式是搜集。整理。收藏和流通图书资料。但在数据共享的信息化时代,信息量的剧增。读者需求的驱动以及图书馆自身发展的推动,这一模式已经不能满足读者的需要。高校信息资源只有在满足用户需求的基础上,才能做好信息化资源的服务工作。因此,应构建高校间协同化服务链信息共享的模式,为高校带来全新的信息共享运行机制。
首先,借助于信息技术和网络技术,将高校图书馆服务内容进一步深化。随着当前信息搜索技术的不断发展,用户更希望借助于资料直接解决自身的问题。由此可见,内容精确。完整的图书馆资料提供,已经不是高校图书馆唯一的服务模式,高校信息资源库需要能够为用户提供解决问题的方法和技能。因此,在图书馆馆际间协同交互的基础上,开放性进行资料内容的合作,满足用户知识发现需求的前提下,融合各种信息条件下到服务和手段,由此实现高效协同化服务模式的构建。
其次,用户为中心的服务模式创新原则,是信息技术和互联网技术条件下,依据用户需求的动态改变,数字图书馆不断寻求与用户需求新的契合点的过程。比如,如何能够更为迅速和主动的接近读者群体,这需要数字图书馆对用户需求的大数据进行采集和分析。将自身的加工文献资料为主的图书馆资料整理模式过渡到加工知识单元为主导的图书馆资料整理模式。
最后,当前高校数字图书馆资源共享,缺乏国家层面的法律法规的支持,因此,在制度支持方面需要高校间协同制定,互惠互利原则下的各类规章制度,以保证图书馆馆际间合作服务链的正常运行。在制度建设上,应建立保障机制,针对馆际间合作开展监督和评价机制的实施,对合作内容实施的典范进行激励机制的进一步促进。一是在信息资源真实基础上开展实际操作层面的馆际合作信息技术开发。二是构建有序。职责明晰和体质规范的合作机制。三是馆际间合作要具备利益平衡保障机制。
总之,大数据背景的高校信息资源共享库的构建,无论是理念方面还是技术应用方面,无一不是依托于当前的大数据概念。围绕大数据展开的相关技术研究与应用也以惊人的速度在不断进步当中。当前的大数据已经将智慧城市。智慧公交系统。智慧家庭等数据应用前景展示在人们眼前,高校的信息资源共享也只是这些技术研究基础上的延伸。所以,大数据背景的高校信息资源共享库建设不但可行,而且有益于国家。社会和个人的发展,建设高校信息资源共享库有百益而无一害。大数据背景下的高校信息资源共享,其本质是不断构建信息资源共享库和不断实现技术与应用突破的动态建立过程,而不是一劳永逸的单纯应用数据库组合的思维。因此,高校信息资源共享库的建设是多方努力和协调的成果,随着大数据相关技术的进步,这一成果必将沿着持续完善的方向不断推进。
大数据背景下高校信息资源共享库建设探究