数据分析 | 数盟社区 | Page 41
t0169c98b99a33f04ba 0

数据挖掘相关的数学基础

- 数据分析 - 阅 5,062

作者:张迪 面对复杂数据,数据挖掘的基本流程是:首先对原始数据进行填补遗漏、消除异常、平滑噪声等处理,提高数据挖掘的有效性和准确性。然后使用专门的算法对原始数据进行归纳抽象,去掉取之过多且不均匀的属性和概念层次树中不存在的属性,最终得到一个关系模型。当新的…

t0191a3c218871862fd 0

数据清洗全经验分享

- 数据分析 - 阅 2,313

作者:Philip J.Guo 翻译 Chaoslog 平时习惯了在某些特定的数据集合上做实验,简单的tokenization、预处理等步骤就足够了。但是在数据越来越大的年代,数据清洗越来越重要,也越来越复杂。看到Philip J.Guo 的这篇英文文章Parsing Raw Data觉得不错,学习并译成中文,难免谬误…

t01e6a3a232dbce2a4d 0

SPSS K-means聚类分析案例——某移动公司客户细分模型

- 数据分析 - 阅 3,487

作者 : 数据小兵 聚类分析在各行各业应用十分常见,而顾客细分是其最常见的分析需求,顾客细分总是和聚类分析挂在一起。 顾客细分,关键问题是找出顾客的特征,一般可从顾客自然特征和消费行为入手,在大型统计分析工具出现之前,主要是通过两种方式进行“分群别类”,第一种…

150202110636796_副本 0

数据挖掘中分类算法小结

- 数据分析 - 阅 3,309

数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重 要数据集合或预测未来数据趋势的模型。分类方法(Classification)用于预测数据对象的离散类别(Categorical Label);预测方法…

t01fbf231eefc69f826_副本 0

数据分析、数据挖掘、数据统计、OLAP 之间的差异是什么?

- 数据分析 - 阅 2,798

作者:孙文亮 我觉得前三个正好是广义数据分析的三个方向: 数据分析。专注于中小网站分析优化,网站地图、结构优化,SEO。多使用第三方工具如:开源分析模块(BIRT),CNZZ,Google Analytics(以下简称GA)。通过对网站属性数据(如pv, uv, 新用户占比,搜索词,跳出率…

t0145abf8193d822a03_副本 0

美团推荐算法实践:机器学习重排序模型成亮点

- 数据分析 - 阅 3,680

作者:陈明 前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用…

2009102321185236 (1)_副本 0

什么是好的推荐系统?

- 数据分析 - 阅 2,647

作者:2shou 我一直自诩是「菜刀流」的工程师,作为一个数据挖掘的门外汉,竟也操刀过三个推荐系统的项目了。这三个推荐系统,用户群不同,业务场景不同,连地域和文化也有些差别。所以近来总在琢磨,推荐系统的缘起千人千面,纷繁万变的细节当中,能不能汇聚出一些普遍共性?…

00016c58d72214189abc03_副本 0

数据挖掘之九大定律

- 数据分析 - 阅 2,060

作者:Tom Khabaza 译者:qxde01 数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。…