文章 | 数盟 | Page 368
350px-Gradient_descent.svg_副本 0

机器学习中导数最优化方法(基础篇)

- 人工智能 - 阅 8,125

作者:daniel-D 1. 前言 熟悉机器学习的童鞋都知道,优化方法是其中一个非常重要的话题,最常见的情形就是利用目标函数的导数通过多次迭代来求解无约束最优化问题。实现简单,coding 方便,是训练模型的必备利器之一。这篇博客主要总结一下使用导数的最优化方法的几个基本方…

07220637-f472bb13a779481bbfa45a9d79bd2175 0

漫谈:机器学习中距离和相似性度量方法

- 人工智能 - 阅 17,913

作者:daniel-D 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一…

t019a6067dcefb47aed 0

述说我的Hadoop成长路线

- 基础架构 - 阅 6,398

作者:jeff Hadoop启蒙 还在实验室时,老师就建议看google关于大数据的三篇论文,啃了好长时间还是没完全理解。也动手搭建了Hadoop集群,运行了wordcount,带着“Hadoop会火“的指示离开了实验室。 Hadoop入门 2011年初我加入了一个互联网流量分析运营项目,开始真正实…

34 0

技术向:一文读懂卷积神经网络CNN

- 人工智能 - 阅 131,657

作者:张雨石 自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convnet2。为了增进CNN的理解和使用,特写此博文,以其与人交流,互有增益。正文之前,先说几点自己对于CNN的感触。先明确…

t0187cb558aa139a500 0

译文:机器学习ML简史

- 人工智能 - 阅 5,157

译者:张雨石 在科学技术刚刚萌芽的时候,科学家Blaise Pascal和Von Leibniz就想到了有朝一日能够实现人工智能。即让机器拥有像人一样的智能。机器学习是AI中一条重要的发展线,在工业界和学术界都异常火爆。企业、大学都在投入大量的资源来做机器学习方面的研究。最近,机器…

6941baebjw1eprrj7octsj20l50f8djf_副本 0

在Python中对MySQL中的数据进行可视化

- 基础架构,编程语言,可视化 - 阅 9,370

翻译: wayne 本教程的所有Python代码可以在网上的IPython notebook中获取。 考虑在公司里使用Plotly?可以看一下Plotly的on-premises企业版。(注:On-premises是指软件运行在工作场所或公司内部,详见维基百科) 注意操作系统:尽管Windows或Mac用户也可以跟随本文操…

421_副本 0

数据挖掘150道试题 测测你的专业能力过关吗?

- 数据分析 - 阅 8,414

单选题 1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 2. 以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个…

292-1101020U22758_副本 0

贝叶斯的路——概率论迷思

- 人工智能 - 阅 6,621

作者:覃含章 编者按:忽略一下以下错误,这篇文章还是值得一读的。 原文:1、  一个家庭有两个孩子,其中一个是男孩,问另一个也是男孩的概率多少?如对于第一个问题,如果没有“那个家庭”,那么生出一个男孩的概率必然是1/2。可是对那个家庭来说,(相当于我们换了一个样…