十月 | 2014 | 数盟社区
kmeans LDA工程实践之算法篇之(二)SparseLDA算法已关闭评论

LDA工程实践之算法篇之(二)SparseLDA算法

- 人工智能 - 4,414 次阅读

2 SparseLDA算法 本章将介绍一种Gibbs Sampling算法的加速算法——SparseLDA [9],它主要利用LDA 模型的稀疏性,来达到加速以及节省内存的目的,是一种精确算法(没有近似)。 2.1 背景 Porteous等人 [10] 以及Yao等人 [9] 分别给出了自己的解法,都是在优化算法 Stan…

kmeans LDA工程实践之算法篇之(一)算法实现正确性验证已关闭评论

LDA工程实践之算法篇之(一)算法实现正确性验证

- 人工智能 - 8,868 次阅读

研究生二年级实习(2010年5月)开始,一直跟着王益(yiwang)和靳志辉(rickjin)学习LDA,包括对算法的理解、并行化和应用等等。毕业后进入了腾讯公司,也一直在从事相关工作,后边还在yiwang带领下,与孙振龙、严浩等一起实现了一套大规模并行的LDA训练系统——Peacock。受rick影…

123 R为什么比Excel更适合做数据分析?已关闭评论

R为什么比Excel更适合做数据分析?

- 编程语言 - 2,684 次阅读

我从事数据分析工作已经有十年之久。最初是出于工作需要,我的经理给我一堆数据,我需要处理这些数据。当时我一直使用的工具是 Excel,因为这是我熟练掌握的一款工具。三年前,我开始接触到 R,一开始因为功能太多而坚决抵制使用。后来我开始琢磨如何使用。现在我基本不怎么使用 …

t01434f3f3956c1dc09 Python 10 分钟入门已关闭评论

Python 10 分钟入门

- 编程语言 - 1,663 次阅读

初试牛刀         假设你希望学习Python这门语言,却苦于找不到一个简短而全面的入门教程。那么本教程将花费十分钟的时间带你走入Python的大门。本文的内容介于教程(Toturial)和速查手册(CheatSheet)之间,因此只会包含一些基本概念。很显然,如果你希望真正学好一门语言,你还…

156_130115165711_1 43款可视化工具介绍及软件地址已关闭评论

43款可视化工具介绍及软件地址

- 可视化 - 4,533 次阅读

为大家总结出了当前热用的43款可视化工具,包括Arbor、Chroma.js、D3.js、Google Chart Tools等,绝对让你一饱眼福。 1.Tableau Public:http://www.tableausoftware.com/ Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网…

9fcae9f8-59e7-43a2-956a-66d6ef368e94 永洪大数据:一天实现电商企业的数据化营销及运营已关闭评论

永洪大数据:一天实现电商企业的数据化营销及运营

- 未分类 - 1,450 次阅读

(分享嘉宾:永洪科技渠道合作副总经理王桐) 10月23-24日,由艾瑞咨询集团主办的“2014上海艾瑞互联网营销峰会”在上海浦东嘉里大酒店隆重举办。作为艾瑞年度高峰会议的第三站,2014上海艾瑞互联网营销峰会延续了此前北京、深圳两场峰会“守正出奇。融合创新”的主题,以“营销”作…

11151D016_0 数盟Data Science Meetup(DSM201411)@北京已关闭评论

数盟Data Science Meetup(DSM201411)@北京

- 活动 - 4,961 次阅读

【数盟一周年庆纪念视频】 【会议时间】2014年11月16日(周日) 【场地赞助】呼声沙龙·青年汇,北京市朝阳区东大桥路8号SOHO尚都南塔二层2238(中国社工一家) 【礼品赞助】TalkingData赞助8G U盘等小礼品若干,华章科技书院赞助图书若干 【会议规模】200人场地,免费报名…

yimazaixian 0

“大数据“从概念走向应用:大数据,智未来

- 未分类 - 3,470 次阅读

“大数据“从概念走向应用:大数据,智未来 ——“2014亿玛智慧峰会” 11月北京隆重开幕   数据时代正在来临,我们周围的一切正在被数据定义。全球著名商业咨询机构麦肯锡早就说:数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。与我们切身相关的衣 、…