如何理解和认知大数据(Big Data)
Tag:巨量数据(Big Data)、海量数据(Big Data)、数据探勘(Data Mining)、数据挖掘(Data Mining)
一、定义
大数据(Big Data)一词最早出现在未来学家阿尔文?托夫勒《第三次浪潮》一书中,他在书中将“大数据”热情地赞颂为“第三次浪潮的华彩乐章”。约从2009年开始,“大数据”成为网络信息技术行业的流行词汇。
大数据,或称巨量数据、海量数据,是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的集成共用,交叉复用形成的智力资源和知识服务能力。Viktor Mayer-Sch?nberger在其所着的《Big Data》一书中,他将“大数据”定义为不使用随机分析法(抽样调查)这样的捷径,而采用所有数据的一种分析方法。
此外,也有研究机构认为“大数据”是一种新的数据处理模式,具有更强的决策力、洞察发现力和流程优化能力,是一种海量、高增长率和多样化的信息资产。从某种程度上说,大数据是数据分析的前沿技术,具有从各种各样类型的数据中,快速获得有价值信息的能力。
二、‘大数据’的特质
对于大数据,目前通常认为有下述四大特质,称为“四V”特质:
1.巨量(Volume Big)
数据量级已从TB发展至PB乃至ZB,可称海量、巨量乃至超量。
2. 多样(Variable Type)
数据类型繁多,愈来愈多为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息。
3.快速(Velocity Fast)
数据流程往往为高速即时数据流,而且往往需要快速、持续的即时处理;处理工具亦在快速演进,软件工程及人工智慧等均可能介入。
4.高价值和低密度(High Value and Low Density)
以视频安全监控为例,连续不断的监控流中,有重大价值者可能仅为一两秒的数据流程。
三、‘大数据’的价值
社群网站的兴起,大量的UGC(User Generated Content,用户生成内容)内容、音讯、文本信息、影像、图片等非结构化数据出现;谷歌搜索、Facebook的发文和微博消息等。另外,物联网的数据量更大,加上移动互联网能更准确、更快地收集用户信息,比如位置、生活信息等数据等。这些都使得预测用户行为和情绪成为可能。挖掘用户的行为习惯和爱好,在冗杂的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化,这就是大数据的价值(刘志伟)。
参考文献
《电视工程》编辑部(2013)。大数据。电视工程,4,57。
陈如明(2012)。大数据时代的挑战、价值与应对策略。2012中国国际信息通信展专刊,17,14-15。
- 评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
-
