文章 | 数盟 | Page 399
QQ截图20141223202102_副本 0

R语言学习路线和常用数据挖掘包

- 编程语言 - 阅 5,499

对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,一个生手应该从哪一本着…

20141223101728165_副本 0

汇总:大数据必备十大工具

- 文章 - 阅 2,426

随着互联网技术的快速发展,移动互联网和电商的日益普及,使得数据也在日益增长,给企业管理大量的数据带来了挑战的同时也带来了一些机遇。下面是用于信息化管理的大数据工具列表: 1. Apache Hive Hive是一个建立在Hadoop上的开源数据仓库基础设施,通过Hive可以很容…

1406774528230_副本 0

解密最接近人脑的智能学习机器——深度学习及并行化实现

- 人工智能 - 阅 15,292

摘要: 深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别、图像识别和检索、自然语言理解等。深层模型是包含多个隐藏层的人工神经网络,多层非线性结构使其具备强大的特征表达能力和对复杂任务建模能力。训练深层模型是长期以来的难题,近年来以层次化、逐层初始化为…

64_副本 0

Hermes与开源的Solr、ElasticSearch的不同

- 文章 - 阅 2,603

谈到Hermes的索引技术,相信很多同学都会想到Solr、ElasticSearch。Solr、ElasticSearch真可谓是大名鼎鼎,是两个顶级项目,最近有些同学经常问我,“开源世界有Solr、ElasticSearch为什么还要使用Hermes?” 在回答这个问题之前,大家可以思考一个问题,既然已经有了Oracle、My…

QQ截图20141223191038_副本 0

mlpack:可伸缩C++机器学习库

- 人工智能 - 阅 5,166

作者:张红月 mlpack是一个直观、快速、可伸缩的C++机器学习库,旨在为机器学习研究者提供更广泛的机器学习方法和函数。它的目的是让新用户通过简单、一致的API使用机器学习,同时为专业用户提供C++的高性能和最大灵活性。 mlpack官网还提供了大量的学习教程、API和可…

20141222134630106_副本 0

Spark社区的圣诞礼物 : Spark Package

- 基础架构 - 阅 3,369

2014-12-23 陈 超 scala 摘自Reynold的微博 : 随着Spark生态系统的发展,越来越多的公司和组织在Spark上面开发应用和扩展库。随着这些库的增长,用户一直希望有一个类似pip一样的跟踪这些库的网站。今天我们给大家带来一个圣诞礼物: spark-packages.org 上线了! http://s…

t01528e127b0daa5548_副本 0

2014年最佳的大数据,数据科学文章

- 文章 - 阅 3,657

KDNuggets分别总结了2014年14个阅读最多以及分享最多的文章。我们从中可以看到多个主题——深度学习,数据科学家职业,教育和薪酬,学习数据科学的工具比如R和Python以及大众投票的最受欢迎的数据科学和数据挖掘语言。 其中,阅读最多的文章超过10000次阅读,分享最多文章的超过…

t016f8c386091a5a1bf_副本 0

机器学习经典算法详解及Python实现–线性回归(Linear Regression)算法

- 人工智能 - 阅 12,719

作者Adan (一)认识回归 回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。顾名思义,分类算法用于离散型分布预测,如前面讲过的KNN、决策树、朴素贝叶斯、adaboost、SVM、Logis…