文章 | 数盟 | Page 394
640_副本 1

用户画像数据建模方法

- 数据分析 - 阅 5,717

  从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技…

suanfa3-1024x504_副本 0

微博推荐算法简述

- 数据分析 - 阅 4,577

作者:微博推荐 在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的价值?效果如何衡量? 推荐系统诞生很早,但真正被大家所重视,缘起于以”facebook”为代表的社会化网络的兴起和以“淘宝“为代…

t01f92da0b8e961d0a3 (1) 0

机器学习和深度学习学习资料

- 人工智能 - 阅 9,865

比较全面的收集了机器学习的介绍文章,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning。 《机器学习经典论文/survey合集》 介绍:看题目你已经知道了是什么内容,没错。里面有很多经典的机器学习论文值得仔细与反复的阅读。 《Brief History of Ma…

QQ截图20141223170247_副本 0

【TED演讲】数据可视化系列推荐

- 可视化 - 阅 5,575

【TED演讲】统计学:数据图像化系列内容,通过优雅、生动的演讲,TED的演讲者们将海量的数据拆解,让数据变得变得简单易懂,甚至令人兴奋。这门课程将教会你如何将数据视觉化,优雅、引人入胜地呈现这些复杂的统计结果。   (1)大卫·麦克坎德雷斯:数据视觉化之美 …

t01f48c76037adf5f66 0

吴军博士也认同的最全最好的《数学之美》读后感

- 文章 - 阅 5,544

作者:巴菲特门小羊 近期阅读,吴军博士的文字《数学之美》 每每体会,记录一下。 1、自然语言处理研究的"鸟飞派"认为看看鸟怎么飞,就能模仿鸟造出飞机,而不需要了解空气动力学。事实是,怀特兄弟靠的是空气动力学而不是仿生学。 串想: 有那么很少一些的初级投资者…

t01254fb0f796744f87 0

Ramp:快速开发机器学习原型

- 人工智能 - 阅 2,378

Ramp是一个基于pandas的Python库,可以快速开发机器学习解决方案的原型。它是一个轻量级的机器学习框架,可插入已有的Python学习和统计工具(如scikit-learn、rpy2等)。Ramp提供了一个简单的声明性语法探索功能,算法和快速,高效地转换。 Why Ramp? Clean, declarative …

QQ截图20141223204113_副本 0

最受Web应用开发者欢迎的NoSQL和关系型数据库

- 基础架构 - 阅 1,953

作者:李辉 Web应用离不开数据库,目前市场上有种类繁多数据库可供开发者选择,例如SQL、NoSQL、键值、图谱数据库等等。关于不同数据库在开发者中的受欢迎程度也是仁者见仁智者见智,但是通过统计亚马逊这样的公共云平台,我们还是很容易发现数据库之间的流行度存在很大差异。…

QQ截图20141223203308 0

BigData预处理(完整步骤)

- 文章 - 阅 6,112

一:为什么要预处理数据? (1)现实世界的数据是肮脏的(不完整,含噪声,不一致) (2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高质量的数据;数据仓库需要对高质量的数据进行一致地集成) (3)原始数据中存在的问题: 不一致 —— 数据内含出现…