文章 | 数盟 | Page 365
t01fc4da2a9254316de 0

开源机器学习工具scikit-learn入门

- 人工智能 - 阅 38,350

作者:轩辕森 Scikit-Learn是基于python的机器学习模块,基于BSD开源许可证。这个项目最早由DavidCournapeau 在2007 年发起的,目前也是由社区自愿者进行维护。 Scikit-Learn的官方网站是http://scikit-learn.org/stable/,在上面可以找到相关的Scikit-Learn的资源,模块下载,…

333px-6n-graf.svg 0

概率图模型基础总结

- 文章 - 阅 10,138

作者:暗海风 过去的一段时间里,忙于考试、忙于完成实验室要求的任务、更忙于过年,很长时间没有以一种良好的心态来回忆、总结自己所学的东西了。这几天总在想,我应该怎么做。后来我才明白,应该想想我现在该做什么,所以我开始写这篇博客了。这将是对概率图模型的一个很…

QQ截图20150312221412 1

BP 算法之一种直观的解释

- 人工智能 - 阅 4,428

作者:daniel-D 0. 前言 之前上模式识别课程的时候,老师也讲过 MLP 的 BP 算法, 但是 ppt 过得太快,只有一个大概印象。后来课下自己也尝试看了一下 stanford deep learning 的 wiki, 还是感觉似懂非懂,不能形成一个直观的思路。趁着这个机会,我再次 revisit 一下。本文…

11.webp 0

神奇的数据可视化 忽悠你没商量

- 可视化 - 阅 2,712

图为“战争死亡统计图”,作者FlorenceNightingale(南丁格尔)是一名护士,她用数据图表的方式展示了那些可预防疾病(蓝色和灰色区域)导致的惊人死亡数字,成功的说服了将军们投钱在医院和医疗设施上。 看到这幅图,相信读者都会像我一样惊叹于160年前的这位护士的智慧,…

QQ截图20150312195638 0

特征选择常用算法综述

- 人工智能 - 阅 3,245

作者:苍梧 1 综述 (1) 什么是特征选择 特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。   (2) 为什么要做特征选择 在…

QQ截图20150312202244_副本 0

Python爬虫小白入门手册

- 文章,编程语言 - 阅 5,452

作者:十一城 长话短说: 基本的爬虫工作原理 基本的http抓取工具,scrapy Bloom Filter: Bloom Filters by Example 如果需要大规模网页抓取,你需要学习分布式爬虫的概念。其实没那么玄乎,你只要学会怎样维护一个所有集群机器能够有效分享的分布式队列就好。最简…

20140515202416843 0

Convolution Neural Network (CNN) 原理与实现

- 人工智能 - 阅 5,597

作者:Rachel-Zhang 本文结合Deep learning的一个应用,Convolution Neural Network 进行一些基本应用,参考Lecun的Document 0.1进行部分拓展,与结果展示(in python)。 分为以下几部分: 1. Convolution(卷积) 2. Pooling(降采样过程) 3. CNN结构 4.  …

0310020 0

Kafka剖析(一):Kafka背景及架构介绍

- 文章 - 阅 3,032

作者 郭俊 Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。InfoQ一直在紧密关注Kafka的应用以及发展,“Kafka剖析”专栏将会从架构…