大数据包含几个方面的内涵吧
1. 数据量大 ,TB,PB,乃至EB等数据量的数据需要分析处理。
2. 要求快速响应,市场变化快 ,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求 ,所以数据量显得对速度要求有些“大 ” 。
3. 数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗 ,整理,筛选等操作,变为结构数据。
4. 价值密度低 ,由于数据采集的不及时,数据样本不全面,数据可能不连续等等 ,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。
很多行业都会有大数据需求,譬如电信行业 ,互联网行业等等容易产生大量数据的行业,很多传统行业,譬如医药 ,教育,采矿,电力等等任何行业 ,都会有大数据需求。
随着业务的不断扩张和历史数据的不断增加,数据量的增长是持续的 。
如果需要分析大数据,则可以Hadoop等开源大数据项目 ,或Yonghong Z-Suite等商业大数据BI工具。
不同行业的数据有不同的自身特点,还需要结合自身的行业知识才能把大数据转换为价值。
“四个V”界定大数据概念
大数据是一个新的概念,网友从各个领域看到过很多关于大数据概念的描述和界定 ,我们也很想知道从《纲要》的角度上来看,如何了解大数据的概念和内涵 。
这个问题提的非常好,现在我个人认为大数据近几年无论从应用 、从技术、从产业都发展的非常快,而且成为我们全社会一个非常瞩目的热词。但是从客观上来看 ,无论是学术界、产业界还是 *** 界,还是普通老百姓,对大数据这个词 ,BigData这个词汇是缺乏一个统一的共识的。我们可以看到很多大数据的概念和界定的描述,比如说 *** 对大数据的定义,是用我们现有的技术手段无法在期望时间内进行处理的数据的 *** 。然后在学术界大家非常熟悉的关于大数据的界定就是4个V ,四个英文的之一个字母的描述,之一个V就是volume,是大量的。大数据的量很大 ,某一个程度上达到PB级才是大数据,但是有时候几百T也是大数据。
第二个V(variety)是类型,现在随着互联网的发展 ,很多类型不再是我们传统意义上处理的结构化数据,有时候是半结构化,甚至是非结构化,原有的信息技术很难处理的技术 。
第三个V(velocity)是速度 ,就是大数据的处理速度要很快,在很快、很及时的时间内,从大量的数据中来非常及时的获得到我想要的数据和信息。比如说这个数据半个月以后分析出来好了 ,但是对我已经没有用了,时间已经过去了。在公共安全的领域甚至治安的领域,利用数据分析是很现实的一个应用 。
第四个是value ,大家知道,实际上value表示的是价值密度低,它是一个“废品利用” 、“沙里淘金”、“大海捞鱼 ”的过程。从国家发改委牵头从一两年之前开始研究 ,会同工信部等部门来做相关行动纲要的研究和起草。从国家信息化发展大的角度来说,行动纲要的大数据的角度来看,我们学习大数据有一个共识 ,这样才对它的战略、内容会有更好的理解。
以上是小编为大家分享的关于“四个V”界定大数据概念的相关内容,更多信息可以关注环球青藤分享更多干货
本文来自作者[初双]投稿,不代表奇妙号立场,如若转载,请注明出处:https://8x4c.cn/qimiao/2541.html
评论列表(3条)
我是奇妙号的签约作者“初双”
本文概览:大数据包含几个方面的内涵吧 1. 数据量大,TB,PB,乃至EB等数据量的数据需要分析处理。 2. 要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分...
文章不错《什么是大数据》内容很有帮助