附录1: 19
一、大数据概述
(一)大数据定义
对于大数据的定义,目前也没有一个特别完整的定义。单凭从字面理解可以是数据量巨大。但是,大数据绝没有想象的这么简单,从一个初级程序员的理解中可以这样描述:“大数据是从海量的数据中,通过一定的技术手段来获取和筛选对于我们有作用的重要数据”。
(二)大数据的获取
数据的获取,方式很多,只要是存储在介质上的,基本上都可以获取的到,如果想要更加精细的数据,可以通过小程序来获取想要的数据集(如爬虫)。
(三)大数据的分析
数据的分析,首先要做的就是获取数据后的过滤,筛选出数据之后再去分析,利用程序生成图表,或者是生成想要呈现的一种样式。
(四)大数据的特点
大数据所拥有的特点为以下4个方面:数据量大,格式多,时效性高,价值密度低等特点。不仅仅是数据量大这么简单而已。
1、数据量大
通过简单的数据就可以说明数据量大的特点。量化存储大小的单位由GB上升为TB,又由TB上升至EB,EB不能满足,有上升至PB,每一次变化都是原先的1024倍,而这些单位也不够量化了,还有更大的存储单位:ZB、YB、BB,以后还会有更大的单位来描述数据量的大小。在短短几年的实间内就上升至如此体量的高度,可以想象,这些数据对于我们的生活产生了多大的影响。生活中的方方面面都是由这些数据所引导的。
2、格式多
大数据格式多主要体现在它的非结构数据化方面,大数据的数据类型包括很多方面,有网络日志、视频、音频、图片、地理位置、交易信息等,诸如此类能够保存下来的,其作用在商业方面有着不可估量的价值,还有更多的社会价值。
3、时效性高
大数据时效性高体现在一旦获取了相应的数据之后,需要在短时间内给出反馈,否则机会就这样浪费过去了。简单的例子就是当你在访问过一个电商网站之后,再去访问其他的网页,在其他的网页上面可能就会出现之前在电商网站上你曾看过的商品,这就是利用技术手段获取浏览者的访问数据,然后根据访问数据及时的推荐相应广告,针对性比较强,也是比较有用的一种广告精准投放例子。
4、价值密度低
虽然大数据有着相当大的价值,可是价值密度却非常的低。例如用户观看浏览了很多的商品,很多的网站,可是真正能够有价值的确是那么一点点的数据,对大量数据的挖掘与分析才是大数据能够产生价值的痛点需求所在。
二、大数据的现状
(一)大数据的存储现状
大数据时代,每时每刻都会产生大量数据,针对数据的存储,需要出现越来越大的存储介质,存储单位也是在不断的变化,量级越来越高,随着数据的产生,会推动着存储介质的不断发展以满足存储量的不断变化。理论上存储介质存储大量数据已经产生足够大的费用消耗。
(二)大数据的技术分析
大数据最终的目的是为人们的生活带来改善,从海量的数据中提取有用的信息为我们日常的生活提供指导性意义。
如何分析大数据又是另外一种科学,分析大数据需要数据建模分析技术来解决这些问题,尽管相关科研学者提出了一些方法,可仍然不能够达到一种理想的状态。
对于大数据的分析,针对不同的结果需要建立不同的数据模型,从海量的数据中提取出想要的目的信息是需要让机器去学习,通过机器的不断学习来分析如此海量的信息,就目前人们日常的机器来分析如此海量的信息是根本不能满足的。数据的分析是当前大数据中最为重要的一环,关乎着数据结果会对人们的生活产生哪些影响。
- 上一篇:来上海务工人员就业保障问题研究
- 下一篇:农民工养老保险问题及对策研究
-
-
-
-
-
-
-
上市公司股权结构对经营绩效的影响研究
现代简约美式风格在室内家装中的运用
C++最短路径算法研究和程序设计
g-C3N4光催化剂的制备和光催化性能研究
中国传统元素在游戏角色...
高警觉工作人群的元情绪...
江苏省某高中学生体质现状的调查研究
NFC协议物理层的软件实现+文献综述
浅析中国古代宗法制度
巴金《激流三部曲》高觉新的悲剧命运