文章 | 数盟社区 | Page 3
wKioL1msEICQRtSHAABKgDO5-9Y865 0

亚马逊CTO:机器学习的进步是如何推动企业发展的

- 文章,人工智能 - 阅 701

Vogels博士认为往往在事情发生以后我们才能明确是否科技进步了,但是人工智能和机器学习这两项技术有点不同。机器学习作为AI(人工智能)的一部分,对于大规模数据从规则和认知模型上进行描述,完成针对未来数据的预判。这两项技术概念当前几乎是无处不在,并列最热门词汇排行榜…

wKiom1nKCVSit2xkAAHoOVoVaMM379.jpg-wh_651x-s_3899290674 0

大数据计数原理1+0=1这你都不会算(四)

- 文章,数据分析 - 阅 719

这是本坑的第四篇,之前已经说了关于 HashSet 、BitMap 、Bloom Filter 布隆过滤器了,本篇主要讲B-树。 B+树是现在很多索引系统的数据结构,而B-树是B+树的基础,本次先讲B-树。 而在讲B-树之前,又不得不讲二叉搜索树(BST,Binary Search Tree)。二叉搜索树只有…

532 0

10道Hadoop面试真题及解题思路

- 文章,编程语言,人工智能 - 阅 664

(一)海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频…

wKiom1nKA--xMYJIAAHAJjsDqjo065.jpg-wh_651x-s_3422002470 0

漫谈分布式集群的负载均衡—口水篇

- 文章,编程语言 - 阅 579

1 什么是分布式集群 为了理解分布式集群这个概念,我们先说说这两个概念:“集群”和“分布式”。艺术来源于生活,计算机科学亦是如此。我们先通过例子,来了解一下现实生活中的“集群”和“分布式”。 从开餐馆说起:你开了一家餐馆,自己掌勺后厨(即做菜)。随着生意越来越好,发现…

wKioL1nAxQ2hBkZGAALR4Rk1e0I897.jpg-wh_651x-s_4136191686 0

大数据计数原理1+0=1这你都不会算(三)

- 文章,数据分析 - 阅 585

这是本坑的第三篇,之前已经说了关于 HashSet 和 BitMap 了,这次说说 Bloom Filter 布隆过滤器. 我们都知道BitMap已经非常节省空间了,一个值只需要一个 bit 就可以进行统计了,但是,对于上百亿的数据来说,碰撞率即使非常低,但也不是一个可以忽视的问题了。 当…

640.webp (1) 0

大数据计数原理1+0=1这你都不会算(二)

- 文章,数据分析 - 阅 521

上一次我们说完了用 HashSet 来进行计数了。我们可以发现,如果我们估计有N个数,那么我们至少需要N*32bit(按照int在32位操作系统下占用32个bit)的空间来进行存储,这太费钱了。有没有办法进行改进呢?这就引出了一个新的数据结构 - BitMap。 这时候看到一张图代…

技术风险 0

大数据计数原理1+0=1这你都不会算(一)

- 文章,数据分析 - 阅 510

hello哈,大家是不是好久没见到我啦?我也是一直在摸索小伙伴们喜欢看到什么东西,不喜欢看什么东西,还请大家多多支持。为了表示感谢。小蕉在这给你们一鞠躬,二鞠躬,三。事不过三~ 1+0=1你都不会谈什么大数据? 这篇呢,又是开坑之作,这是一个系列,主要会将大数…

20170724095946963 0

从大数据到人工智能 我们还有多远的路要走

- 文章,人工智能 - 阅 480

从去年开始,从政府到企业,从分析机构到业界专家,几乎所有的企业和个人都将目光锁定到了人工智能上。如果说2016年是人工智能的新纪元,人们对于人工智能的探讨还是基于概念的探讨和前景的展望上,那么2017年则是人工智能如何落地的关键一年。 从去年开始,从政府到企业,从分…