数盟社区 | Page 385
KafkaArchitecture 0

Kafka深度解析,众人推荐,精彩好文!

- 6,454 次阅读 - 基础架构

作者:Jason Guo 背景介绍 Kafka简介 Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下: 以时间复杂度为O(1)的方式提供消息持久化能力,并保证即使对TB级以上数据也能保证常数时间的访问性能 高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每…

sy_61183184241_副本 0

一个谷歌程序员的算法学习之路

- 11,867 次阅读 - 文章

作者:巩朋 关于 严格来说,本文题目应该是我的数据结构和算法学习之路,但这个写法实在太绕口——况且CS中的算法往往暗指数据结构和算法(例如算法导论指的实际上是数据结构和算法导论),所以我认为本文题目是合理的。 这篇文章讲了什么? 我这些年学习数据结构和算法的…

12150100-288706d6594e443ea03911cd3db43809 0

傅里叶变换:MP3、JPEG和Siri背后的数学

- 2,856 次阅读 - 文章

翻译:programmer_lin 九年前,当我还坐在学校的物理数学课的课堂里时,我的老师为我们讲授了一种新方法,给我留下了深刻映像。 我认为,毫不夸张地说,这是对数学理论发现最广泛的应用。应用的领域包括:量子物理、射电天文学、MP3和JPEG压缩、X-射线晶体学、语音识别、PE…

122 0

【数盟培训】数据可视化课程第2期

- 6,442 次阅读 - 课程

数盟推出了国内首届数据可视化在线实战课程,如今数据可视化第一期学员已经临近毕业,快来看看第一期学员们的部分作品吧~ 看了这些可视化DEMO作品,你想不想快他人一步Get这个技能呢?那就快来参加数盟第二期的数据可视化课程吧~    【课程大纲】 课程名称 培训内…

20140615.3 0

详解数据挖掘十大经典算法

- 4,204 次阅读 - 数据分析

作者:莫等闲 国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的1…

t01ffcf6ccd911d5a74 0

基于大规模语料的新词发现算法

- 2,987 次阅读 - 数据分析

作者:顾森 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢? 这就是所谓的分…

t01da5a7e950c8ee38e 0

最流行的4个机器学习数据集

- 9,813 次阅读 - 人工智能

作者:紫松 机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数据系列博文的开篇,列举了4个最流行的机器学习数据集。 Iris Iris也称鸢尾花卉数…

242244194064209 0

微软收购R语言开发公司 强化云计算业务

- 2,075 次阅读 - 未分类

据彭博社网站报道,微软已经与创业公司 Revolution Analytics 达成收购协议,目的是强化云计算业务。微软和 Revolution Analytics 没有披露收购协议条款。微软当地时间周五发表博文称,促使该公司收购 Revolution Analytics 的原因在于,企业需要处理的数据量不断增长,以及…