人工智能 | 数盟 | Page 133
201101022146263350 0

机器学习中的数学(3):模型组合(Model Combining)之Boosting与Gradient Boosting

- 人工智能 - 阅 3,457

作者:LeftNotEasy 前言: 本来上一章的结尾提到,准备写写线性分类的问题,文章都已经写得差不多了,但是突然听说最近Team准备做一套分布式的分类器,可能会使用Random Forest来做,下了几篇论文看了看,简单的random forest还比较容易弄懂,复杂一点的还会与boosting等算…

t01254d2b8872258de4_副本 0

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

- 数据分析,人工智能 - 阅 13,290

作者:@52nlp 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python…

201012191117186311 0

机器学习中的数学(2):线性回归,偏差、方差权衡

- 人工智能 - 阅 3,837

作者:LeftNotEasy 前言: 机器学习可不是一个完全的技术性的东西,之前和部门老大在outing的时候一直在聊这个问题,机器学习绝对不是一个一个孤立的算法堆砌起来的,想要像看《算法导论》这样看机器学习是个不可取的方法,机器学习里面有几个东西一直贯穿全书,比如说数据…

hclust-1_副本 0

盘点几种k-means会失效的情形(K-means clustering is not a free lunch)

- 人工智能 - 阅 2,353

作者:David Robinson K-means是最常用的聚类算法之一:容易理解,实现不难,虽然会有local optimum,但通常结果也不差。但k-means也不是万金油,比如在一些比较复杂的问题和非线性数据分布上,k-means也会失败。普林斯顿博士David Robinson写了一篇不错的分析文章,介绍了几…

t0133d63a3357b128f1 0

​兔子和分布式机器学习

- 人工智能 - 阅 3,457

作者:@陈天奇怪 上个学习的时候,我除了TA机器学习以外,另外一半的时间就是上了System课程。因为上课的缘故,需要做一个课程项目,于是我决定做一些和分布式机器学习相关的事情。 来到UW之后每一个和engineering的课程设计都会想做一些高效实用的东西。这一次一开始想到…

image_thumb_9 0

机器学习中的数学(1):回归(regression)、梯度下降(gradient descent)

- 人工智能 - 阅 4,471

作者:LeftNotEasy 前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,在verycd可下载,可惜没有翻译。不过还是可以看。另外一个是prml-…

QQ截图20150120193235_副本 0

Hadoop 2.0 上深度学习的解决方案

- 基础架构,人工智能 - 阅 2,753

作者:Sunil Khanal 翻译:周键 波士顿的 数据科学团队正在利用尖端工具和算法来优化商业活动,且这些商业活动是基于对用户数据中的深刻透析。数据科学大量使用机器算法,可以帮助我们在数据中识别和利用模式。从互联网大规模数据中获取透析是一项具有挑战性的任务,因此,能…

201405230857296703 0

生成模型(Generative Model) 和判别模型(Discriminative Model)

- 人工智能 - 阅 5,215

作者:龚书 【摘要】    - 生成模型(Generative Model) :无穷样本==》概率密度模型 = 产生模型==》预测    - 判别模型(Discriminative Model):有限样本==》判别函数 = 预测模型==》预测 【简介】 简单的说,假设o是观察值,q是模型。 如果对P(o|q)建模,就是Generati…