数盟 | Page 527
t011e28022c7211b171 0

朴素贝叶斯文本分类算法学习

- 5,883 次阅读 - 人工智能

一.Naive Bayes基础知识可以参考上篇文章【朴素贝叶斯分类器的应用】,此处略详细内容。 二.朴素贝叶斯的两种模型 朴素贝叶斯分类器是一种有监督学习,常见有两种模型。 多项式模型(multinomial model)即为词频型。 伯努利模型(Bernoulli model)即文档型。 …

5461b52185b80 0

15款值得学习的小型开源项目

- 2,150 次阅读 - 文章

SeaJS Sea.js是一个遵循CommonJS规范的JavaScript模块加载框架,可以实现JavaScript的模块化开发及加载机制。Sea.js 追求简单、自然的代码书写和组织方式,代码非常精简。 Koa Koa 是下一代的 Node.js 的 Web 框架。由 Express 团队设计。旨在提供一个更小型、更富有表现…

gmm 0

漫谈 Clustering (3): Gaussian Mixture Model

- 1,900 次阅读 - 人工智能

感谢微信:李元祥,分享资源 上一次我们谈到了用 k-means 进行聚类的方法,这次我们来说一下另一个很流行的算法:Gaussian Mixture Model (GMM)。事实上,GMM 和 k-means 很像,不过 GMM 是学习出一些概率密度函数来(所以 GMM 除了用在 clustering 上之外,还经常被用于 densit…

230711vkpxjtpr410rj04t 0

Science发表的超赞聚类算法

- 2,851 次阅读 - 人工智能

作者(Alex Rodriguez, Alessandro Laio)提出了一种很简洁优美的聚类算法, 可以识别各种形状的类簇, 并且其超参数很容易确定. 算法思想 聚类过程 那些有着比较大的局部密度ρi和很大的δi的点被认为是类簇的中心. 局部密度较小但是δi较大的点是异常点.在确定了类簇中心之后, 所…

boke_7 0

数据可视化初体验(R语言)

- 3,494 次阅读 - 编程语言,可视化

我对数据可视化的认识 前些天通过一张美丽的图片,闯进了FlowingData这个世界,开始真正去了解数据可视化。“The greatest value of a picture is when it forces us to notice what we never expected to see”是该网站about中的第一句话,在逛了不少可视化的网站和博客之后,个…

20141110111235283 0

世界前沿的六大“数据可视化”创业公司

- 3,894 次阅读 - 未分类

1.Ayasdi Ayasdi来自印第安语,是“寻找”的意思。斯坦福大学的Gurjeet Singh,Gunnar Carlsson和Harlan Sexton一直在致力于将拓扑学的研究方法应用于数据分析。在2008年,他们联合成立了Ayasdi公司。Ayasdi成立以后,就获得了DARPA(美国国防部高级研究项目组)350万美元的资…

t01434f3f3956c1dc09 0

标准爬虫初探,来自Python之父的大餐!

- 3,610 次阅读 - 文章,编程语言

首先不得不承认自己做了标题党,本文实质是分析500lines or less的crawl工程,这个工程的地址是https://github.com/aosabook/500lines,有兴趣的同学可以看看,是一个非常高质量的开源工程集合,据说要写一本书,不过看着代码提交记录,这本书面世时间应该不会很快。这篇文章写得…

Empire-Building-700x466 0

《Empire Building》数据可视化(开发总结)

- 2,051 次阅读 - 文章,可视化

作者:任远 今天和大家分享一下《Empire Building》数据可视化项目的开发思路,整个过程如下: 一、分析新闻资料: 根据相关报道分析新闻事件中存在的信息和关系 1.人物有姓名、相关简介、分组三类信息 2.公司有名字、相关简介、类别三类信息 3.人物和人物之间有关…