数盟 | Page 552
9060_1372741530_0 如何成为一名数据科学家?已关闭评论

如何成为一名数据科学家?

- 3,937 次阅读 - 未分类

一、数据科学家的起源 "数据科学"(DataScience)起初叫"datalogy "。最初在1966年由Peter Naur提出,用来代替"计算机科学"(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后来的程序设计…

fa3519f4260166a56f3e7a0362df58d9 概念,算法,应用,迄今为止对大数据研究最透彻的文章已关闭评论

概念,算法,应用,迄今为止对大数据研究最透彻的文章

- 5,445 次阅读 - 未分类

一、 大数据基本概念 大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。 大数据的预处理 主要完成对已接收数据的辨析…

kmeans LDA工程实践之算法篇之(二)SparseLDA算法已关闭评论

LDA工程实践之算法篇之(二)SparseLDA算法

- 5,460 次阅读 - 人工智能

2 SparseLDA算法 本章将介绍一种Gibbs Sampling算法的加速算法——SparseLDA [9],它主要利用LDA 模型的稀疏性,来达到加速以及节省内存的目的,是一种精确算法(没有近似)。 2.1 背景 Porteous等人 [10] 以及Yao等人 [9] 分别给出了自己的解法,都是在优化算法 Stan…

kmeans LDA工程实践之算法篇之(一)算法实现正确性验证已关闭评论

LDA工程实践之算法篇之(一)算法实现正确性验证

- 10,947 次阅读 - 人工智能

研究生二年级实习(2010年5月)开始,一直跟着王益(yiwang)和靳志辉(rickjin)学习LDA,包括对算法的理解、并行化和应用等等。毕业后进入了腾讯公司,也一直在从事相关工作,后边还在yiwang带领下,与孙振龙、严浩等一起实现了一套大规模并行的LDA训练系统——Peacock。受rick影…

123 R为什么比Excel更适合做数据分析?已关闭评论

R为什么比Excel更适合做数据分析?

- 3,183 次阅读 - 编程语言

我从事数据分析工作已经有十年之久。最初是出于工作需要,我的经理给我一堆数据,我需要处理这些数据。当时我一直使用的工具是 Excel,因为这是我熟练掌握的一款工具。三年前,我开始接触到 R,一开始因为功能太多而坚决抵制使用。后来我开始琢磨如何使用。现在我基本不怎么使用 …

t01434f3f3956c1dc09 Python 10 分钟入门已关闭评论

Python 10 分钟入门

- 1,941 次阅读 - 编程语言

初试牛刀         假设你希望学习Python这门语言,却苦于找不到一个简短而全面的入门教程。那么本教程将花费十分钟的时间带你走入Python的大门。本文的内容介于教程(Toturial)和速查手册(CheatSheet)之间,因此只会包含一些基本概念。很显然,如果你希望真正学好一门语言,你还…

156_130115165711_1 43款可视化工具介绍及软件地址已关闭评论

43款可视化工具介绍及软件地址

- 5,965 次阅读 - 可视化

为大家总结出了当前热用的43款可视化工具,包括Arbor、Chroma.js、D3.js、Google Chart Tools等,绝对让你一饱眼福。 1.Tableau Public:http://www.tableausoftware.com/ Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网…

9fcae9f8-59e7-43a2-956a-66d6ef368e94 永洪大数据:一天实现电商企业的数据化营销及运营已关闭评论

永洪大数据:一天实现电商企业的数据化营销及运营

- 1,742 次阅读 - 未分类

(分享嘉宾:永洪科技渠道合作副总经理王桐) 10月23-24日,由艾瑞咨询集团主办的“2014上海艾瑞互联网营销峰会”在上海浦东嘉里大酒店隆重举办。作为艾瑞年度高峰会议的第三站,2014上海艾瑞互联网营销峰会延续了此前北京、深圳两场峰会“守正出奇。融合创新”的主题,以“营销”作…