数据分析 | 数盟 | Page 61
t01224c64985e625d91_副本 0

互联网公司机器学习、数据挖掘类的职位面试主要考察哪些?

- 数据分析 - 阅 3,724

作者:Orangeprince 我觉得从事数据挖掘工作,尤其是在互联网行业,主要需要三个方面的能力,即机器学习和数据挖掘的理论知识、编程开发与数据结构算法的基础和业务理解与沟通表达的能力。 上面的图里列出了这个行业不同类型的从业者机器特点。 A. 主要是负责做最顶…

t01ea0bef73554fc1f1 0

介绍两款数据清洗工具——DataWrangler、Google Refine

- 数据分析 - 阅 4,423

在进行数据分析和可视化之前,经常需要先“清洗”数据。这意味着什么?可能有些词条列表里是“New York City”,而其他人写成“New York, NY”。然而,你在看到某些模式前得将各种各样的输入词汇标准化。又或者,出现一些数值输入错误,错别字什么的。 有很多工具都可以实现你想要的…

t010db563741391d0f8 0

如何系统地学习数据挖掘?

- 数据分析 - 阅 7,554

作者:夏方舟 数据挖掘:What?Why?How? 这个问题思考了很久,作为过来人谈一谈,建议先看下以前的一些回答。 什么是数据挖掘? 怎么培养数据分析的能力? 如何成为一名数据科学家? 磨刀不误砍柴工。在学习数据挖掘之前应该明白几点: 数据挖掘目前在中国…

t0169c98b99a33f04ba 0

数据挖掘相关的数学基础

- 数据分析 - 阅 7,943

作者:张迪 面对复杂数据,数据挖掘的基本流程是:首先对原始数据进行填补遗漏、消除异常、平滑噪声等处理,提高数据挖掘的有效性和准确性。然后使用专门的算法对原始数据进行归纳抽象,去掉取之过多且不均匀的属性和概念层次树中不存在的属性,最终得到一个关系模型。当新的…

t0191a3c218871862fd 0

数据清洗全经验分享

- 数据分析 - 阅 2,622

作者:Philip J.Guo 翻译 Chaoslog 平时习惯了在某些特定的数据集合上做实验,简单的tokenization、预处理等步骤就足够了。但是在数据越来越大的年代,数据清洗越来越重要,也越来越复杂。看到Philip J.Guo 的这篇英文文章Parsing Raw Data觉得不错,学习并译成中文,难免谬误…

t01e6a3a232dbce2a4d 0

SPSS K-means聚类分析案例——某移动公司客户细分模型

- 数据分析 - 阅 4,363

作者 : 数据小兵 聚类分析在各行各业应用十分常见,而顾客细分是其最常见的分析需求,顾客细分总是和聚类分析挂在一起。 顾客细分,关键问题是找出顾客的特征,一般可从顾客自然特征和消费行为入手,在大型统计分析工具出现之前,主要是通过两种方式进行“分群别类”,第一种…

150202110636796_副本 0

数据挖掘中分类算法小结

- 数据分析 - 阅 3,639

数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重 要数据集合或预测未来数据趋势的模型。分类方法(Classification)用于预测数据对象的离散类别(Categorical Label);预测方法…

t01fbf231eefc69f826_副本 0

数据分析、数据挖掘、数据统计、OLAP 之间的差异是什么?

- 数据分析 - 阅 3,024

作者:孙文亮 我觉得前三个正好是广义数据分析的三个方向: 数据分析。专注于中小网站分析优化,网站地图、结构优化,SEO。多使用第三方工具如:开源分析模块(BIRT),CNZZ,Google Analytics(以下简称GA)。通过对网站属性数据(如pv, uv, 新用户占比,搜索词,跳出率…