三月 | 2015 | 数盟社区
t01c6488328c3155779 0

我的碎碎念:Docker入门指南

- 文章 - 2,006 次阅读

之前曾经翻译过很多Docker入门介绍的文章,之所以再翻译这篇,是因为Anders的角度很独特,思路也很调理。你也可以看下作者的演讲稿 《Docker, DevOps的未来》 。本文介绍了Docker的一些基本概念、诱人的特性、Docker的工作原理、日常管理基本操作,以及一些Docker的问题的解决方…

t017596eb78a53eac5a 0

教你挖掘出啤酒和尿布关系的大法——关联算法

- 文章 - 2,034 次阅读

所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。其中前者主要用在互联网的内容和文档上,比如搜…

204737q31fk3qou73m4nqo_副本 0

零基础学习hadoop到上手工作线路指导(编程篇)

- 基础架构 - 5,854 次阅读

作者:nettman 问题导读: 1.hadoop编程需要哪些基础? 2.hadoop编程需要注意哪些问题? 3.如何创建mapreduce程序及其包含几部分? 4.如何远程连接eclipse,可能会遇到什么问题? 5.如何编译hadoop源码? 阅读此篇文章,需要些基础下面两篇文章 零基础学习hadoop…

timthumb 0

用Apache Kafka构建流数据平台的一些建议

- 文章 - 3,191 次阅读

作者 谢丽 在《流数据平台构建实战指南》第一部分中,Confluent联合创始人Jay Kreps介绍了如何构建一个公司范围的实时流数据中心。本文是根据第二部分整理而成(第一部分)。在这一部分中,Jay给出了一些构建数据流平台的具体建议。 限制集群数量 Kafka集群数量越少,系统架…

117814933_副本 0

说一说那些有望从科幻电影走到现实中的神奇技术

- 未分类 - 1,677 次阅读

我们可能从未如此接近未来。现在,你已经可以在市场中买到采用柔性屏幕的曲面设计手机、电视;智能手表已经是非常常见的设备,而虚拟现实显示器则很快会成为下一个进入消费市场的新型设备。当然,你的智能手机已经可以做很多事情,包括指纹验证、心率监测、移动支付……那么,接下…

t01d2d0591034ec18f2 0

豆瓣 PARACEL:让分布式机器学习变得简单

- 人工智能 - 2,286 次阅读

在豆瓣,我们常通过机器学习的方式从各种数据中训练出模型,利用这些模型帮助我们理解用户并为大家挖掘出有价值的内容:豆瓣FM的个性化歌曲推荐、书影音的喜欢也喜欢、首页的豆瓣猜等等。 早期的时候,单机训练的程序基本就能满足需求。一方面数据量不大,另一方面有的模型算…

pptv 0

InfoQ中国八周年,极客邦扬帆起航

- 未分类 - 1,627 次阅读

再次数盟祝贺媒体合作伙伴InfoQ中国八周年~ 2015年3月28日,在人来人往的北京中关村创业大街上的极客咖啡,近百位过去8年和InfoQ中国一同成长的朋友齐聚一堂,共同庆祝InfoQ中国(微信号:infoqchina)的八周年生日。 时间回到2006年,加拿大资深技术专家Floyd Marinescu刚和…

1289543127773_副本 0

分类决策树算法——C4.5详解

- 文章 - 8,568 次阅读

作者:Yanjun C4.5是机器学习算法中的另一个分类决策树算法,它是基于ID3算法进行改进后的一种重要算法,相比于ID3算法,改进有如下几个要点: 用信息增益率来选择属性。ID3选择属性用的是子树的信息增益,这里可以用很多方法来定义信息,ID3使用的是熵(entropy, 熵是一…