文章 | 数盟 | Page 365
344 0

Facebook的实时Hadoop系统

- 基础架构 - 阅 2,763

作者:Solrex Yang Facebook 在今年六月 SIGMOD 2011 上发表了一篇名为“Apache Hadoop Goes Realtime at Facebook”的会议论文 (pdf),介绍了 Facebook 为了打造一个实时的 HBase 系统使用到的独门秘技。由于该论文提到的应用场景与小弟负责的系统要解决的问题域有相似之处…

t01423195a989437daa 0

EasyPR:一个开源的中文车牌识别系统

- 文章 - 阅 11,522

作者:计算机的潜意识 我正在做一个开源的中文车牌识别系统,Git地址为:https://github.com/liuruoze/EasyPR。 我给它取的名字为EasyPR,也就是Easy to do Plate Recognition的意思。我开发这套系统的主要原因是因为我希望能够锻炼我在这方面的能力,包括C++技术、计算机图…

t015821b63ebf72504c 0

浅谈:协同过滤算法CF

- 文章 - 阅 9,844

作者:ACdreamers 今天要讲的主要内容是 协同过滤,即Collaborative Filtering,简称 CF。 Contents    1. 协同过滤的简介    2. 协同过滤的核心    3. 协同过滤的实现    4. 协同过滤的应用   1. 协同过滤的简介 关于协同过滤的一个最经典的例…

QQ截图20150330203854 0

数据库要变天!阿里 OceanBase 五年破茧为蝶

- 基础架构 - 阅 2,989

之前我一篇文章预测阿里、百度、腾讯未来将是IT硬件厂商的最大对手,今天看到一则消息,淘宝顶级科学家阳振坤微博号@阿里正祥 ,发出一则消息。“从上周五开始,淘宝/天猫/聚划算在支付宝上的交易,100%都在OceanBase上了。你可能没有什么感觉。” 五年前立项,今天成果斐然,作…

t012d5ab9cd265b1b70 0

从一个R语言案例学线性回归

- 人工智能 - 阅 8,207

作者:jason 写在前面的话   按照正常的顺序,本文应该先讲一些线性回归的基本概念,比如什么叫线性回归,线性回规的常用解法等。但既然本文名为《从一个R语言案例学会线性回归》,那就更重视如何使用R语言去解决线性回归问题,因此本文会先讲案例。 线性回归简介 如下图…

t01e3e5e79c0be316d7_副本 0

我们为什么要思考算法?

- 文章 - 阅 3,642

源头 “算法”的中文最早出现在中国汉代的数学名著《周髀算经》中。《周髀算经》卷上有:“数之法出于圆方。圆出于方,方出于矩。矩出于九九八十一”。意思是: 算数的方法都出于对圆、对方的计算,其中圆出于方(圆形面积=外接正方形x圆周率/4),方出于矩(正方形源自两边相等的矩)…

t01073db403d98ffc07 0

四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps

- 人工智能 - 阅 80,447

作者:xbinworld 引言: 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据点映射后的低维向量表达,通常y的维度小于x…

QQ截图20150329203043 0

Spark 1.3.0版中 DataFrame 小试牛刀

- 基础架构 - 阅 11,370

作者:@GavinBuildSomething 三月中旬,Spark发布了最新的1.3.0版本,其中最重要的变化,便是DataFrame这个API的推出。DataFrame让Spark具备了处理大规模结构化数据的能力,在比原有的RDD转化方式易用的前提下,计算性能更还快了两倍。这一个小小的API,隐含着Spark希望大一统…