数据分析 | 数盟 | Page 41
2_400_300 0

大数据沙龙嘉宾分享之一:关于小米大数据技术的实践

- 数据分析 - 阅 1,840

在数盟25期活动大数据沙龙武汉站,我们有幸请到了欧阳辰先生。欧阳辰是小米公司研发架构师,负责小米广告平台的架构和数据。之前曾为微软公司工作10年,担任高级软件开发主管,领导团队参与微软搜索索引和搜索广告平台的研发 工作,曾负责微软上下文广告的全部研发工作,包括系统…

cf1b9d16fdfaaf51d3ccc4618c5494eef11f7ac4 0

关于妹子自拍神器“美拍”,你不得不知的那些事儿

- 数据分析 - 阅 1,907

【嘉宾简介】 Fan,美图公司数据高级总监, 留美博士,本科毕业清华大学,并在美国卡耐基梅隆大学完成博士阶段学习,曾任职Facebook与Google Switzerland,专注于广告与推荐排序的研发。2015年底加入美图公司负责数据部门工作。 大家好!很高兴能有这个交流的机会。准备这次…

20141217031338463 0

Airbnb 数据基础设施与其背后的哲学

- 数据分析 - 阅 1,226

在 Airbnb 我们提倡数据文化并使用数据作为关键输入去决策。跟踪指标,通过实验验证假设,建立机器学习模型和深入挖掘商业洞察是我们快速聪明前进的关键。经过多年的进化,我们觉得数据基础设施服务稳定,可靠,可扩展,因此是一个很好的机会来分享我们的经验给社区。 这第…

2000 0

深度 | Hadoop数据操作系统YARN全解析

- 数据分析 - 阅 1,423

作者:董西成    InfoQHadoop YARN的生态系统为了能够对集群中的资源进行统一管理和调度,Hadoop 2.0引入了数据操作系统YARN。YARN的引入,大大提高了集群的资源利用率,并降低了集群管理成本。首先,YARN允许多个应用程序运行在一个集群中,并将资源按需分配给它们,这大大提高…

20140827165219_94556 0

用python统计日志中IP的数量

- 数据分析 - 阅 1,608

作者:take小蚊子to  出处:51CTO博客 引 入 日志文件,是我们记录用户行为的重要手段。而对于不同的用户,我们往往又会根据IP来区分,所以统计日志文件中的IP访问,对于数据分析人员和相关运营专员来说,是一件重要的事情,这里,采用python这门语言来完成这个小功能…

1447246644611 0

换个思路看12306,其核心模型设计思路到底复杂在哪里?

- 数据分析 - 阅 1,518

作者:汤雪华 元宵节结束,年就真的过完了。挥别故里,回到打拼的城市,理性思维是否也跟着工作状态一起回归了呢?每一年的春运都是对12306的一次大考,抛去盲从和偏见,让我们用工程师的思维重新打量、从业务分析的角度去探讨,12306的核心模型设计思路和架构设计到底复杂在…

bin-laden-bookshelf 0

Python文本分析:本·拉登最常念叨什么?

- 数据分析 - 阅 2,068

2015年,美国官方解密了一系列有关本·拉登的文件,其中最引人瞩目的,是美国国家情报总监办公室(The Office of the Director of National Intelligence)在其官网上列出的“本·拉登的书架”。 曝光的这份阅读清单涉及书籍和其他材料400余种。其中包含了已解密的书信等文档103份…

u=2225820470,3075872104&fm=206&gp=0 0

组成数据分析师完整知识结构的七大板块

- 数据分析,职业规划 - 阅 1,580

作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知识结构。 1. 数据采集 了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容…