文章 | 数盟 | Page 417
162714kj5gy6bb2jbyqcyh 【数盟聚会分享】31页PPT:基于Spark的移动大数据挖掘已关闭评论

【数盟聚会分享】31页PPT:基于Spark的移动大数据挖掘

- 数据分析,基础架构 - 阅 4,646

数盟11.16 Data Science Meetup(DSM北京)分享:基于Spark的移动大数据挖掘 分享嘉宾:张夏天(TalkingData首席数据科学家) @张夏天_机器学习 内容提要: TalkingData移动数据服务现状和挑战 为什么选择Spark TalkingData移动大数据挖掘 应用、系统和算法 …

170435bzmahfmhf3mj0w6f 【数盟聚会资源】PPT:大数据小数据,一天实现可视化分析已关闭评论

【数盟聚会资源】PPT:大数据小数据,一天实现可视化分析

- 数据分析,可视化 - 阅 3,624

数盟11.16 Data Science Meetup(DSM北京)分享:大数据小数据,一天实现可视化分析 分享嘉宾:王桐 (永洪科技渠道VP) 内容提要: 传统数据分析/商业智能的做法和问题: 1.IT人员需事先建模,提前汇总好数据,业务人员在前端查看分析结果报表 2.业务人员查看的报表…

141107101811256 大数据的威力有多大?看34张世界级的大数据分析图!已关闭评论

大数据的威力有多大?看34张世界级的大数据分析图!

- 可视化 - 阅 3,563

世界人口聚居地,红色越深人口密度越大;灰色代表无人地带。 点评:地球不堪重负…… 全球冰川融化后的世界地图 点评:日本、台湾竟然都还在,不科学……澳大利亚有内海了…… 全世界每100人拥有枪支的数量 点评:美利坚都黑了——几乎人手一枪;话说如此高的持枪率,凶杀…

kmeans LDA工程实践之算法篇之(二)SparseLDA算法已关闭评论

LDA工程实践之算法篇之(二)SparseLDA算法

- 人工智能 - 阅 5,328

2 SparseLDA算法 本章将介绍一种Gibbs Sampling算法的加速算法——SparseLDA [9],它主要利用LDA 模型的稀疏性,来达到加速以及节省内存的目的,是一种精确算法(没有近似)。 2.1 背景 Porteous等人 [10] 以及Yao等人 [9] 分别给出了自己的解法,都是在优化算法 Stan…

kmeans LDA工程实践之算法篇之(一)算法实现正确性验证已关闭评论

LDA工程实践之算法篇之(一)算法实现正确性验证

- 人工智能 - 阅 10,782

研究生二年级实习(2010年5月)开始,一直跟着王益(yiwang)和靳志辉(rickjin)学习LDA,包括对算法的理解、并行化和应用等等。毕业后进入了腾讯公司,也一直在从事相关工作,后边还在yiwang带领下,与孙振龙、严浩等一起实现了一套大规模并行的LDA训练系统——Peacock。受rick影…

123 R为什么比Excel更适合做数据分析?已关闭评论

R为什么比Excel更适合做数据分析?

- 编程语言 - 阅 3,143

我从事数据分析工作已经有十年之久。最初是出于工作需要,我的经理给我一堆数据,我需要处理这些数据。当时我一直使用的工具是 Excel,因为这是我熟练掌握的一款工具。三年前,我开始接触到 R,一开始因为功能太多而坚决抵制使用。后来我开始琢磨如何使用。现在我基本不怎么使用 …

t01434f3f3956c1dc09 Python 10 分钟入门已关闭评论

Python 10 分钟入门

- 编程语言 - 阅 1,908

初试牛刀         假设你希望学习Python这门语言,却苦于找不到一个简短而全面的入门教程。那么本教程将花费十分钟的时间带你走入Python的大门。本文的内容介于教程(Toturial)和速查手册(CheatSheet)之间,因此只会包含一些基本概念。很显然,如果你希望真正学好一门语言,你还…

156_130115165711_1 43款可视化工具介绍及软件地址已关闭评论

43款可视化工具介绍及软件地址

- 可视化 - 阅 5,865

为大家总结出了当前热用的43款可视化工具,包括Arbor、Chroma.js、D3.js、Google Chart Tools等,绝对让你一饱眼福。 1.Tableau Public:http://www.tableausoftware.com/ Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网…