文章 | 数盟社区 | Page 271
QQ截图20150613211517 0

基于腾讯信鸽平台的手游流失用户预测模型概览

- 文章 - 阅 2,372

【编者按】借助大数据和机器学习做用户流失的预测分析是当前的一个应用趋势。本文由腾讯大数据团队技术人员撰写,介绍依托腾讯信鸽平台做手游用户的流失预测。文章着眼于数据、算法和系统三个方面,总结了一套手游通用的业务流失预测模型。本次流失预测的建模中采用了LR模型。 …

u=3036723124,3066656037&fm=21&gp=0_副本 0

智擒啤酒小贼:使用 Python 和 OpenCV 检测和跟踪运动对象

- 文章 - 阅 3,133

出处:伯乐在线 这个该死的家伙。我就知道他偷了我最后一罐啤酒! 对于一个男人来讲,这些话永远都不该说。但是当我关上冰箱门的时候,我愤怒地叹息,感到厌恶,自言自语地说了这些。 你看,我花了12个小时写了这篇将要发表的文章《PyImageSearch Gur…

u=1068384158,883784220&fm=21&gp=0 0

MYSQL数据库常用知识大全

- 基础架构 - 阅 3,551

出处:运维技术 MYSQL数据库常用知识整理 什么是MYSQL MYSQL的特性 MYSQL存储引擎的分类以及数据文件的介绍 MYSQL赋权 MYSQL备份与恢复 MYSQL的基本操作:增删查改 MYSQL的基本故障判断与处理 MYSQL的调优 MYSQL主主、主从复制的实现 MYSQL大数据备份和…

QQ截图20150609183304_副本 0

Python 数据分析入门

- 文章 - 阅 5,998

出处:伯乐在线 最近,Analysis with Programming加入了Planet Python。作为该网站的首批特约博客,我这里来分享一下如何通过Python来开始数据分析。具体内容如下: 数据导入 导入本地的或者web端的CSV文件; 数据变换; 数据统计描述; 假设检验 单样…

t015787a10c8c0059e3 0

译:使用 scikit-learn 进行机器学习的简介

- 文章 - 阅 3,882

出处:Tacey Wong的博客 概要: 该章节,我们将介绍贯穿scikit-learn使用中的“机器学习(Machine Learning)”这个词汇,并给出一些简单的学习示例。 一、机器学习:问题设定 通常,一个学习问题是通过分析一些数据样本来尝试预测未知数据的属性。如果每一个样本不仅仅是一…

sparkR_副本 0

Spark 1.4正式发布:SparkR,钨丝计划锋芒初露

- 基础架构 - 阅 2,575

作者:仲浩 出处:csdn 6月11日(美国时间),Spark 1.4版本正式发布,在Spark Core、Spark Streaming、Spark SQL(DataFrame)、Spark ML/MLlib等升级之外,新版本更加入了科学家们望眼欲穿的SparkR组件。长话短说,下面一起看Databricks B上关于SparkR的介绍,以及七牛技术总…

t01407c52a32650b14e_副本 0

Facebook 如何向十亿人推荐东西?

- 文章 - 阅 1,339

作者 张天雷   出处:infoq 为了保证用户体验和使用效果,推荐系统中的机器学习算法一般都是针对完整的数据集进行的。然而,随着推荐系统输入数据量的飞速增长,传统的集中式机器学习算法越来越难以满足应用需求。因此,分布式机器学习算法被提出用来大规模数据集的分析。作为…

QQ截图20150611203715 0

10分钟!搞懂泊松分布 and 指数分布

- 文章 - 阅 5,059

作者: 阮一峰   出处:阮一峰的网络日志 大学时,我一直觉得统计学很难,还差点挂科。 工作以后才发现,难的不是统计学,而是我们的教材写得不好。比起高等数学,统计概念其实容易理解多了。 我举一个例子,什么是泊松分布和指数分布?恐怕大多数人都说不清楚…