文章 | 数盟 | Page 322
QQ截图20150426224901 0

Druid:一个用于大数据实时处理的开源分布式系统

- 基础架构 - 阅 2,626

Druid是一个用于大数据实时查询和分析的高容错、高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。尤其是当发生代码部署、机器故障以及其他产品系统遇到宕机等情况时,Druid仍能够保持100%正常运行。创建Druid的最初意图主要是为了解决查询延迟问题,…

machine-learning-meet-computer-vision-3 0

当机器学习遇到计算机视觉

- 文章 - 阅 3,434

计算机视觉在上一个世纪60年代脱胎于人工智能与认知神经科学,旨在通过设计算法来让计算机自动理解图像的内容。为“解决”计算机视觉这一问题,麻省理工学院在1966年把它作为一个夏季项目正式提出,但人们很快发现要解决这个问题可能还需要更长的时间。在50年后的今天,一般的…

QQ截图20150426222908 0

如何在Python中实现这五类强大的概率分布

- 文章 - 阅 5,488

R编程语言已经成为统计分析中的事实标准。但在这篇文章中,我将告诉你在Python中实现统计学概念会是如此容易。我要使用Python实现一些离散和连续的概率分布。虽然我不会讨论这些分布的数学细节,但我会以链接的方式给你一些学习这些统计学概念的好资料。在…

u=2864778817,408393977&fm=15&gp=0_副本 0

面向Python初学者的资源总结

- 编程语言 - 阅 3,700

之前看到了 汪汪汪不是我的语言 在 喵在野 的基础上写的这篇文章《Python 零基础入门资料整理(更新版)》,感觉实在是太简陋了。虽说是针对初学者的Python零基础入门,但是很多的适合初学者的网站、教程、书籍、视频都根本没有囊括进去。 看看自己的收藏夹,决定拿出来,补充一…

VzqmYf 0

在R语言中使用正则表达式

- 文章 - 阅 5,531

有时候我们要处理的是非结构化的数据,例如网页或是电邮资料,那么就需要用R来抓取所需的字符串,整理为进一步处理的数据形式。R语言中有一整套可以用来处理字符的函数,在之前的 博文 中已经有所涉及。但真正的要用好字符处理函数,则不得不用到正则表达式。 正则表达式(Regula…

t018e92e42afb06df43 0

机器学习项目中最常见的误区有哪些

- 文章 - 阅 3,254

在最近的一次报告中,Ben Hamner向我们介绍了他和他的同事在Kaggle比赛中看到的一些机器学习项目的常见误区。 这个报告于2014年2月在Strate举办,名为《机器学习小精灵》。 在这篇文章中,我们将从Ben的报告中了解一些常见的误区,它们是什么及如何避免陷入这些误区。 机…

二胎 0

BAT、Facebook、IBM等国内外一流互联网公司的Hadoop应用现状

- 基础架构 - 阅 11,153

写在前面:本文给出了国内、国外Hadoop的应用现状,很多数据是比较旧的了,现在也许已经发生了重大变化(比如阿里已经转而使用自己内部的阿里云平台),但对于那些正在选型的技术人员而言,仍具有较高的参考价值。 摘要:Hadoop是一个开源的高效云计算基础架构平台,其不仅仅…

QQ截图20150424182855 0

Which GPU to use for deep learning?

- 文章 - 阅 3,375

Selecting a GPU is much more complicated than selecting a computer. Since we are going to use CUDA for deep learning, only NVIDIA GPUs will be considered. You have to know many jagons, like PCI-E x.0, Architecture (Fermi (GF110), Kepler(GK104,GK110), Maxwell,…