数据分析 | 数盟社区
wKiom1nKCVSit2xkAAHoOVoVaMM379.jpg-wh_651x-s_3899290674 0

大数据计数原理1+0=1这你都不会算(四)

- 文章,数据分析 - 阅 716

这是本坑的第四篇,之前已经说了关于 HashSet 、BitMap 、Bloom Filter 布隆过滤器了,本篇主要讲B-树。 B+树是现在很多索引系统的数据结构,而B-树是B+树的基础,本次先讲B-树。 而在讲B-树之前,又不得不讲二叉搜索树(BST,Binary Search Tree)。二叉搜索树只有…

wKioL1nAxQ2hBkZGAALR4Rk1e0I897.jpg-wh_651x-s_4136191686 0

大数据计数原理1+0=1这你都不会算(三)

- 文章,数据分析 - 阅 582

这是本坑的第三篇,之前已经说了关于 HashSet 和 BitMap 了,这次说说 Bloom Filter 布隆过滤器. 我们都知道BitMap已经非常节省空间了,一个值只需要一个 bit 就可以进行统计了,但是,对于上百亿的数据来说,碰撞率即使非常低,但也不是一个可以忽视的问题了。 当…

640.webp (1) 0

大数据计数原理1+0=1这你都不会算(二)

- 文章,数据分析 - 阅 518

上一次我们说完了用 HashSet 来进行计数了。我们可以发现,如果我们估计有N个数,那么我们至少需要N*32bit(按照int在32位操作系统下占用32个bit)的空间来进行存储,这太费钱了。有没有办法进行改进呢?这就引出了一个新的数据结构 - BitMap。 这时候看到一张图代…

技术风险 0

大数据计数原理1+0=1这你都不会算(一)

- 文章,数据分析 - 阅 508

hello哈,大家是不是好久没见到我啦?我也是一直在摸索小伙伴们喜欢看到什么东西,不喜欢看什么东西,还请大家多多支持。为了表示感谢。小蕉在这给你们一鞠躬,二鞠躬,三。事不过三~ 1+0=1你都不会谈什么大数据? 这篇呢,又是开坑之作,这是一个系列,主要会将大数…

wKioL1meakHw9oUwAACNGagHQ5M388.jpg-wh_651x-s_491605474 0

数据竞争背后的思考:我们如何对待未来新石油?

- 文章,数据分析 - 阅 326

毋庸置疑,石油是工业时代以来最重要的动力能源,美国国务卿基辛格(Henry Alfred Kissinger)曾言,“如果你控制了石油,你就控制了所有国家”,自然,石油也是商业竞争的核心命脉。 数据是未来的新石油,正在改变竞争的性质和方式 毋庸置疑,石油是工业时代以来最重要的动力能源…

20170922100203228 0

8000万条公民数据泄漏背后,黑客与医疗机构之战愈演愈烈

- 文章,数据分析 - 阅 437

近日,《法制日报》刊文《超过7亿条公民信息遭泄露,8000余万条公民信息被贩卖》,曝出黑客入侵了某部委的医疗服务信息系统,大量孕检信息遭到泄露和买卖。 一石激起千层浪。微博上不少用户担忧,“说不定就有我。”医疗数据安全,这个略显老套的话题再次成为焦点。 在全球范围内…

640.webp (1) 0

科技大公司正在利用大数据颠覆资本主义的基本规则

- 文章,数据分析 - 阅 414

福鲁哈尔:我们用个人数据为Facebook等公司的服务“付费”,它们据此向零售商等收费,这最终又会转嫁到我们身上。 过去几周,要求政界人士和监管者遏制科技巨头垄断力量的压力不断加大。在9月12日的一场演讲中,美国联邦贸易委员会(Federal Trade Commission)代理主席莫琳•奥…

timg 0

什么是大数据及其背后的关键技术

- 文章,数据分析,人工智能 - 阅 562

我们每天都在吃饭,睡觉,工作,玩耍,与此同时产生大量的数据。根据IBM调研的说法,人类每天生成2 5亿(250亿)字节的数据。 这相当于一堆DVD数据从地球到月球的距离,涵盖我们发送的文本、上传的照片、各类传感器数据、设备与设备之间的通信的所有信息等。 分析大量数据只是使大…