大数据(大数据认证)

Connor 火币huobi中国 2024-04-24 80 0

现在大数据已经成为这个时代下非常热门的话题。大数据运营商正是基于自身用户数据的背景,利用云计算系统和数据模型分析来获取准确的用户数据。运营商大数据与其强大的用户剖析能力和数据漏斗技术相结合,可以对用户数据进行综合分析和数据采集技术。只要是与互联网相关的行业,都会用到大数据。

今天聊聊大数据的十大局限性。

大数据(大数据认证)

在这里谈论大数据的十大局限性,并不是要否定它的价值。相反,只有充分认识大数据的特点、优势和劣势,才能更有效地采集、处理和应用,其价值才能得到充分挖掘和发挥。

1、数据噪声:与生俱来的不和谐

大数据之所以是大数据,首先是因为它的数据量巨大。然而,在这海量的数据中,并不是所有的数据都是有用的,很多情况下,有用的数据甚至只是其中的一小部分。随着数据量的不断增加,会出现越来越多的无意义的冗余和垃圾数据,其增长速度快于数据信息的增长速度。这样,我们所追求的重要数据信息,往往会被庞大的数据所带来的噪音所淹没,甚至会被引入歧途和陷阱,导致错误的结论。

2、真实性:不得不接受的虚假

让我们陷入困境的不是我们不知道的,而是我们知道的。真实性是一切数据价值的基础,但也是大数据的一大出生缺陷。

3、代表性:永不可能的全样本

大数据来源大致可以分为两大类,一类是来自物理世界的科学数据,如实验数据、传感器数据、观测数据等。另一类来自于人类的社会活动,主要是互联网数据,如社会关系、商品交易、行为轨迹等个人信息。

4、完整性:广度与深度的缺失

大数据缺乏完整性,主要是指单个组织虽然可以获取海量数据,但实际包含的信息非常有限,很难在此基础上进行复杂的逻辑运算或全面的描述。这种不完全性主要包括信息维度的缺失(决定信息的广度)和维度信息的缺失(决定信息的深度)。

但是,目前的大数据仍然以独立孤岛的形式存在,没有任何一家机构能够在广度和深度上获得足够的数据。要在全社会大力推进数据的公开和共享,政府数据的公开就显得尤为重要。可以毫不夸张地说,真正的核心数据大部分掌握在政府手中。没有政府的参与,就没有真正意义上的大数据。

5、时效性:秒级价值存在

任何数据都位于一个连续的时间轴上,都有它的时间属性,即数据年龄。不同年龄段的数据具有不同的价值特征。一般来说,老数据具有整体或趋势分析价值,而新数据则具有更多的个体应用价值。在大数据时代,信息更新非常快。从应用的角度看,大数据的时效性往往很短。

6、解释性:不能没有因果关系

大数据(大数据认证)

相关性代表过去和个别情况,无法解释,有时是错误的,不能一概而论。只有掌握了事物间的因果关系、因果机制和科学原理,才能举一反三,迭代更新,不断推动社会进步。这是很简单的道理,不用多说。

7、预测性:让过去决定未来

大数据分析再聪明、再有才华,从根本上来说也只是对过去和现实的一种归纳和总结,并不具备趋势性和方向性的特征。决定趋势的是事物发展的内在因素和相互作用。在这方面,大数据是无能为力的,这也是大数据固有的缺陷之一。

8、误导性:数据也会说谎

与大数据的代表性、真性、完整性、可解释性等局限性相关,只看统计现象的结果而不强调解释,可能会得出错误甚至危险的结结论。

9、合法性:数据安全与隐私保护

大数据本身及其收集和使用可能涉及个人隐私、商业秘密、公共权利和国家信息安全。因此,安全性和合法性问题构成了大数据价值的限制因素之一。

业务和技术固然重要,但业务和技术驱动的价值观更重要。

诚然,安全性和合法性要求限制了大数据的使用和商业价值的充分发挥,但从社会价值的角度来看,这是值得的,也是必要的。

10、价值性:投入与收益的平衡

值密度低是大数据公认的特征之一,这在一定程度上限制了大数据的研究和应用。

一方面,由于大数据的低密度值特性,要使其价值可用,必须有足够的规模数据积累和有效的价值提取。以常规监控视频为例,在24小时的连续视频监控中,有用的数据可能只有几秒钟。如何通过强大的机器能力优化存储,并快速完成数据处理和价值呈现,仍然是大数据迄今为止面临的一大难题。另一方面,大数据边际效用递增规律的存在,使得很多企业和组织的数据无法满足基本的规模要求,其数据的价值无法充分展现。

此外,收集、存储、处理和使用大数据的资金成本和时间成本都非常高。作为大数据投资主体,应该在投资和收益间做一个合理的平衡。目前,的确有这样一股力量,强力鼓励企业出于某种目的进行大规模的大数据投资。如果不仔细评估,可能得不偿失。

大数据已经悄悄潜入我们生活的方方面面,改变了我们的生活方式,也提高了我们的生活水平,在未来大数据技术会继续迭代更新,人才缺口也越来越大。

关注微信公众号:洛克精准营销

评论