文章 | 数盟 | Page 346
12 0

【案例】可视化书签商Pinterest使用MemSQL和Spark Streaming进行实时数据分析

- 数据分析 - 阅 2,905

Pinterest是一家提供可视化书签工具的公司,这种工具可以帮助人们发现并保存有创意的想法,目前这家公司正使用实时数据分析来达到以数据驱动决策的目的。实验中使用了MemSQL和Spark这样的技术,用以分析来自全球的用户实时行为信息。 通过MemSQL和Spark,Pinterest创建了一条…

t01aa61c750412bdc26 0

Spark 1.2.2和Spark 1.3.1同时发布(都是稳定版)

- 基础架构 - 阅 3,679

Spark 1.2.2和Spark 1.3.1于美国时间2015年4月17日同时发布。两个都是维护版本,并推荐所有1.3和1.2的Spark使用用户升级到相应的版本。 spark 1.2.2(稳定版本) spark 1.2.2主要是维护版本,修复了许多Bug,是基于Spark 1.2的分支。并推荐所有使用1.2.1的用户升级到这个稳定版…

t01650ccee12943ac2b 0

为Java程序员编写的Scala的入门教程

- 编程语言 - 阅 6,983

本文是《A Scala Tutorial for Java programmers》英文的翻译,英文版地址A Scala Tutorial for Java programmers。是Michel Schinz和Philipp Haller编写,由Bearice成中文,dongfengyee(东风雨)整理. 一、简介 二、 第一个Scala例子 三、Scala与Java交互 四、Scala:万物…

t0115d127429a7776b4_副本 0

利用图片指纹检测高相似度图片

- 文章 - 阅 2,344

大概五年前吧,我那时还在为一家约会网站做开发工作。他们是早期创业公司,但他们也开始拥有了一些稳定用户量。不像其他约会网站,这家公司向来以洁身自好为主要市场形象。它不是一个供你鬼混的网站——是让你能找到忠实伴侣的地方。 由于投入了数以百万计的风险资本(在US…

机器学习 0

常用的机器学习&数据挖掘知识(点)总结

- 数据分析 - 阅 18,379

作者:尾巴子 Basis(基础): MSE(Mean Square Error 均方误差), LMS(LeastMean Square 最小均方), LSM(Least Square Methods 最小二乘法), MLE(MaximumLikelihood Estimation最大似然估计), QP(Quadratic Programming 二次规划), CP(Conditional Probability条件概率…

d31b0ef41bd5ad6e858a2de383cb39dbb6fd3c43 0

十分钟理解矩阵!

- 文章 - 阅 3,034

作者:孟岩 前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候不被那位强势的学生认为是神经病,还是比较难的事情。 可怜的chensh,谁让你趟这个地…

6941baebgw1er48xhuq2hj20h2082gmi 0

怎样利用Spark Streaming和Hadoop实现近实时的会话连接

- 文章 - 阅 2,357

这个 Spark Streaming 样例是怎样将近实时会话带到到Hadoop中的一个很好的例子。 Spark Streaming 是Apache Spark 中最有趣的组件之一。利用Spark Streaming,你可以通过使用与处理批量加载数据相同的API来创建数据管道,并通过数据管道处理流式数据。此外,Spark Steaming的“…

1-140224200J5207 1

数据分析师面试的77个常见问题,你准备好了吗?

- 数据分析 - 阅 8,252

随着我国经济决策逐渐由拍脑袋的“经验决策”转向“数据决策”,项目数据分析成为战略决策、经营决策、投资决策必备的科学方法论。数据分析岗位已经成为企业重要的岗位,数据分析师也越来越多的受到重视。数据分析师面试时面试官喜欢问那些问题,我们可以从国外的数据科学家面试问题…