文章 | 数盟社区 | Page 234
t01673770f1417f655a_副本 0

在Apache Spark上跑Logistic Regression算法

- 文章 - 阅 4,311

作者:Leonard Giura 出处:csdn 本文旨在介绍使用机器学习算法,来介绍Apache Spark数据处理引擎。我们一开始会先简单介绍一下Spark,然后我们将开始实践一个机器学习的例子。我们将使用Qualitative Bankruptcy数据集,来自UCI机器学习数据仓库。虽然Spark支持同时Java,Scal…

t012366e61c52d9046b 0

老叶观点:MySQL开发规范之我见

- 基础架构 - 阅 2,114

作者:叶金荣  出处:iMySQL 大多数MySQL规范在网上也都能找得到相关的分享,在这里要分享的是老叶个人认为比较重要的,或者容易被忽视的,以及容易被混淆的一些地方。 1、默认使用InnoDB引擎 【老叶观点】已多次呼吁过了,InnoDB适用于几乎99%的MySQL应用场景,而且在MyS…

t01d329f05aeaceabde_副本 0

克服了这些磨难,深度学习将更加优秀!

- 文章 - 阅 2,362

本文选自ACM,作者Chris Edwards,机器之心汪汪、张之乎、Wangyue翻译,Rita校对。 出处:微信公众号_机器之心(almosthuman2014) 随着理论和硬件的飞速发展,神经网络已经成为了在线服务(比如微软的必应)的核心部件,推动着它们图像搜索和语音识别系统的发展。这些公司…

fengmian-20140321_副本 0

你真的知道怎么玩用户画像么?再谈用户画像的方法、实践与行业应用

- 文章 - 阅 2,351

分享:百分点首席架构师刘译璟博士

t019c7602eca80be2a7_副本 0

基于 Python 和 Scikit-Learn 的机器学习介绍

- 文章 - 阅 3,605

出处:伯乐在线 你好,%用户名%! 我叫Alex,我在机器学习和网络图分析(主要是理论)有所涉猎。我同时在为一家俄罗斯移动运营商开发大数据产品。这是我第一次在网上写文章,不喜勿喷。 现在,很多人想开发高效的算法以及参加机器学习的竞赛。所以他们过来问我:”该如何…

t01a122530b3417b391_副本 0

深度学习中对抗样本的八个误解与事实

- 文章 - 阅 3,119

出处:CSDN 在kdnuggets此前发布的文章(Deep Learning’s Deep Flaws)’s Deep Flaws中,深度学习大神Yoshua Bengio和他的博士生、Google科学家Ian Goodfellow在评论中与作者就深度学习对抗样本(Adversarial Examples)展开了热烈的讨论,kdnuggets编辑邀请Ian Goodfellow撰文…

python1 0

数据科学家必知必会的 7 款 Python 工具

- 文章 - 阅 2,443

出处:开源中国 如果你有志于做一个数据专家,你就应该保持一颗好奇心,总是不断探索,学习,问各种问题。在线入门教程和视频教程能帮你走出第一步,但是最好的方式就是通过熟悉各种已经在生产环境中使用的工具而为成为一个真正的数据专家做好充分准备。 我咨询了我们…

QQ截图20150720211801_副本 0

Spark与Flink:对比与分析

- 文章 - 阅 3,249

Spark是一种快速、通用的计算集群系统,Spark提出的最主要抽象概念是弹性分布式数据集(RDD),它是一个元素集合,划分到集群的各个节点上,可以被并行操作。用户也可以让Spark保留一个RDD在内存中,使其能在并行操作中被有效的重复使用。Flink是可扩展的批处理和流式数据处理的数…