文章 | 数盟 | Page 350
幻灯片1 0

淘宝内部PPT:Spark Streaming 场景下两类倾斜问题的研究

- 基础架构 - 阅 4,989

作者:余根茂 内容提要: 问题背景 CPU资源倾斜问题 源数据倾斜问题 小结 ppt详情  

t011cfdd5dae97a6615 0

浅析人脸检测之Haar分类器方法

- 人工智能 - 阅 2,576

作者:Ello 由于工作需要,我开始研究人脸检测部分的算法,这期间断断续续地学习Haar分类器的训练以及检测过程,在这里根据各种论文、网络资源的查阅和对代码的理解做一个简单的总结。我试图概括性的给出算法的起源、全貌以及细节的来龙去脉,但是水平有限,只能解其大概,希…

t014e367e7927938f44 0

推荐系统的坑!

- 数据分析 - 阅 2,675

作者:王小科科科 不知不觉,从事推荐系统相关工作已近两年,这两年自己踩坑,看人踩坑已然不少。记得一位资深从业者说“现在看起来,推荐系统就是个坑啊!”,心有戚戚的同时又不禁思索,到底坑在哪? 第一坑:高估系统对用户需求的捕捉能力 我们都说,搜索引擎是满足用…

t01d8af69810ae9bae3 1

机器学习(Machine Learning)&深度学习(Deep Learning)资料汇总

- 人工智能 - 阅 21,552

《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning. 《Deep Learning in Neural Networks: An Overview》 介绍:这是瑞士人工智能实验室Jurgen Sc…

pagerank-02 0

使用TextRank算法为文本生成关键字和摘要

- 数据分析,人工智能 - 阅 8,631

作者:樂天 TextRank算法基于PageRank,用于为文本生成关键字和摘要。其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004. 先从PageRank讲起 在浅入浅出:PageRank算法这篇博客中我做过简要…

t01a74b291ce47eaf4f 0

数据分析那点事!

- 数据分析 - 阅 2,528

作者:曹政(caoz) 先声明一下,按照传统的定义,我还真不是数据分析高手,各种关联算法,只会最简单的一种(话说不少场合还算管用);各种挖掘技术,基本上一窍不通;各种牛逼的数据分析工具,除了最简单的几个免费统计平台之外,基本上一个都不会用。所以,各种高手高高手…

Analyzing the Data 0

我为什么热衷于推荐SPSS

- 数据分析 - 阅 1,869

作者:数据小兵 向数据分析爱好者推荐SPSS是我最喜欢干的事情,甚至给自己刻意地加上SPSS自由推广人的标签,啥叫自由推广,我的理解就是我把我认为有效的工具和方法分享给大家,这个过程是我自己意愿支配,但不是我强加给你。一句话概括,因为SPSS实用。 数据分析,在…

131937241511786 0

教程:手把手一步一步教你做“词云图”

- 文章 - 阅 5,198

作者:BIWORK 开篇介绍 我们经常在各个媒体,微信圈,个人博客看到类似于这样的图片。第一感觉就是很漂亮,接着就在想这个东西是怎么做到的,觉 得非常有意思。与以往相比,这些图片上要表达和突出重点的方式很特别。比如通过地图,人物来突出一些重点,关键词,这种表达方…