数据分析 | 数盟 | Page 64
5a04c6c130d8d9cd9dccca6a8025_480_476_副本_副本 0

给想成为一名数据分析师的新手指导

- 数据分析 - 阅 3,121

翻译: HanSir 本文是著名学习网站Udacity的数据分析基础性文章。由于Udacity的就业导向,不同于单纯介绍学习路径,文章还从职业人士的角度讲述数据分析的方方面面。文章同时附有视频,不失为一篇好的介绍文。以下为小标题: - 数据分析师们做些什么? - 如何在没有相关正…

t01a74b291ce47eaf4f 0

数据分析师常见的10道面试题解答

- 数据分析 - 阅 4,110

1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大…

u=69531381,14298861&fm=21&gp=0 0

一位数据分析师的“狗血”数据分析之路

- 数据分析 - 阅 3,411

我本科毕业于一个三流的二本院校,专业是三流中的三流—市场营销。大学前三年在各种游戏中度过,连兼职和实习的经历都没有。到大四的时候突然开始恐慌,觉得这样下去连工作都找不到了,于是立马开启了考研的节奏。可是突然发现已经三年没有学习的我再也难以重新捡起书本了,再加当…

t01224c64985e625d91_副本 0

互联网公司机器学习、数据挖掘类的职位面试主要考察哪些?

- 数据分析 - 阅 3,742

作者:Orangeprince 我觉得从事数据挖掘工作,尤其是在互联网行业,主要需要三个方面的能力,即机器学习和数据挖掘的理论知识、编程开发与数据结构算法的基础和业务理解与沟通表达的能力。 上面的图里列出了这个行业不同类型的从业者机器特点。 A. 主要是负责做最顶…

t01ea0bef73554fc1f1 0

介绍两款数据清洗工具——DataWrangler、Google Refine

- 数据分析 - 阅 4,697

在进行数据分析和可视化之前,经常需要先“清洗”数据。这意味着什么?可能有些词条列表里是“New York City”,而其他人写成“New York, NY”。然而,你在看到某些模式前得将各种各样的输入词汇标准化。又或者,出现一些数值输入错误,错别字什么的。 有很多工具都可以实现你想要的…

t010db563741391d0f8 0

如何系统地学习数据挖掘?

- 数据分析 - 阅 7,606

作者:夏方舟 数据挖掘:What?Why?How? 这个问题思考了很久,作为过来人谈一谈,建议先看下以前的一些回答。 什么是数据挖掘? 怎么培养数据分析的能力? 如何成为一名数据科学家? 磨刀不误砍柴工。在学习数据挖掘之前应该明白几点: 数据挖掘目前在中国…

t0169c98b99a33f04ba 0

数据挖掘相关的数学基础

- 数据分析 - 阅 8,231

作者:张迪 面对复杂数据,数据挖掘的基本流程是:首先对原始数据进行填补遗漏、消除异常、平滑噪声等处理,提高数据挖掘的有效性和准确性。然后使用专门的算法对原始数据进行归纳抽象,去掉取之过多且不均匀的属性和概念层次树中不存在的属性,最终得到一个关系模型。当新的…

t0191a3c218871862fd 0

数据清洗全经验分享

- 数据分析 - 阅 2,643

作者:Philip J.Guo 翻译 Chaoslog 平时习惯了在某些特定的数据集合上做实验,简单的tokenization、预处理等步骤就足够了。但是在数据越来越大的年代,数据清洗越来越重要,也越来越复杂。看到Philip J.Guo 的这篇英文文章Parsing Raw Data觉得不错,学习并译成中文,难免谬误…