数据分析 | 数盟 | Page 34
1466581345911050751 0

如何避免自嗨型的数据分析?你必知的三大法则

- 数据分析 - 阅 1,484

身为数据分析师的你,有没有经历过这样的苦恼? 写了那么多页PPT没人耐心看? 提了那么多的数据后却没有然后? 业务部门觉得你拿着高薪没干啥活(O(∩_∩)O哈哈~) ... ... 是的,数据分析师们拉了很多数据、画了很多图、建了很多模型,但是,并没有传说中的数据驱动业…

1318142313343 0

CS231n课程笔记翻译:最优化笔记(上)

- 数据分析 - 阅 1,995

作者:杜客 链接:https://zhuanlan.zhihu.com/p/21360434 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 译者注:本文译自斯坦福CS231n课程笔记Optimization Note,课程教师Andrej Karpathy授权翻译。本篇教程由杜客翻译完成,堃堃和…

u=1613003797,2892789947&fm=21&gp=0 0

从0开始学习 GitHub 系列之「Git 进阶」

- 数据分析 - 阅 1,286

关于 Git 相信大家看了之前一系列的文章已经初步会使用了, 但是关于Git还有很多知识与技巧是你不知道的,今天就来给大家介绍下一些 Git 进阶的知识。 1. 用户名和邮箱 我们知道我们进行的每一次commit都会产生一条log,这条log标记了提交人的姓名与邮箱,以便其他人方便的查看…

201407171112 0

为什么说Spark SQL远远超越了MPP SQL

- 数据分析 - 阅 1,307

作者:祝威廉 Apache Spark Future 吐槽Spark,其实我看了半天没看懂他在说啥。不过总体而言DataBricks公司目前很多的做法其实蛮合我的理念的。 前言 首先我这里说的并不是性能,因为我没尝试对比过(下文会有简单的说明),而是尝试从某种更高一层次的的角度去看,为什么Spark…

1013 0

一文告诉你机器学习中进行模型评价、模型选择和算法选择的终极方法(PART I)

- 数据分析 - 阅 6,341

本文为数盟原创译文,转载请注明出处为“数盟社区”。   by Sebastian Raschka   引言   机器学习已经成为我们生活中的一部分,对购买者、消费者或是希望进行研究和实践者都很重要!无论我们应用预测建模技术来进行我们的研究还是解决业务问题,…

p23424357 0

用朴素贝叶斯进行文本分类(下)

- 数据分析,数据挖掘 - 阅 2,691

作者: 龙心尘 && 寒小阳 时间:2016年2月。 出处: http://blog.csdn.net/longxinchen_ml/article/details/50629110 http://blog.csdn.net/han_xiaoyang/article/details/50629587 声明:版权所有,转载请联系作者并注明出处 1. 引言 上一篇文章我们主要从理论上…

1416-587x429 0

ALS 在 Spark MLlib 中的实现

- 数据分析 - 阅 1,274

原作者: 孟祥瑞|来自: csdn   深受用户喜爱的大数据处理平台 Apache Spark 1.3 于前不久发布,MLlib 作为 Spark 负责机器学习 (ML) 的核心组件在 1.3 中添加了不少机器学习及数据挖掘的算法:研究主题分布的 latent Dirichlet allocation (LDA)、估计点集分布的高…

p23424357 0

用朴素贝叶斯进行文本分类(上)

- 数据分析 - 阅 2,135

作者:龙心尘 && 寒小阳 时间:2016年1月。 出处: http://blog.csdn.net/longxinchen_ml/article/details/50597149 http://blog.csdn.net/han_xiaoyang/article/details/50616559 声明:版权所有,转载请联系作者并注明出处 1. 引言 贝叶斯方法是一个…