数据分析 | 数盟社区 | Page 2
20160513125244_fd18f191738b2fa5adcecea505dca6e7_1 0

分布式计算开源框架Hadoop入门实践(二)

- 文章,数据分析 - 阅 428

作者:岑文初 其实参看Hadoop官方文档已经能够很容易配置分布式框架运行环境了,不过这里既然写了就再多写一点,同时有一些细节需要注意的也说明一下,其实也就是这些细节会让人摸索半天。Hadoop可以单机跑,也可以配置集群跑,单机跑就不需要多说了,只需要按照Demo的运行…

timg 0

图文解说:用数据来理解设计,让我用数据论来征服你!

- 文章,数据分析 - 阅 223

作者:慕歌  来源:站酷 电商的视觉创意中,一个好的页面所要做的也是要做到的不仅仅是视觉上觉得这是一个好作品,在用户体验上也需要做到一个“好” 数据证明一切,这是前几年一个运营对我说的一句话。我是一个被数据论征服的设计人员,我相信我不是第一个也不会是最后一个…

timg 0

Facebook、亚马逊等巨头是如何建造自己的数据库的?

- 文章,数据分析 - 阅 287

Facebook的工程师发明了Presto,一种针对点对点分析进行优化的定制分布式的SQL查询引擎。 在Keen IO,我们认为会运用事件数据的公司才具有竞争优势,世界领先的科技公司证明了这一点。但是我们仍然对Facebook、Amazon、Airbnb、Pinterest和Netflix数据团队所做的事情感到…

timg (1) 0

当今世界最有价值的资源是什么?不是石油,而是数据

- 文章,数据分析 - 阅 268

《经济学人》发表封面文章称,数据已经取代石油成为当今世界最有价值的资源,而面对这一新的变化,反垄断监管者也应该转变思维。 一种新的大宗商品正在一个利润丰厚、增长迅猛的行业中酝酿,反垄断监管者也开始着手限制那些有能力控制这种商品的人。如果是在一个世纪前,这种商…

wKiom1cdyp3A1P4WAAA8cwxb24s97.jpeg-wh_651x-s_1936879122 0

有一家大数据公司,曾估值41亿,可IPO时只有19亿,为何?

- 文章,数据分析 - 阅 417

文 | 李喆 摘要:Cloudera在技术与产品方面优势明显,但运营能力制约公司发展。未来毛利率有望提升至80%,销售费用将直接影响未来盈利空间。 万众瞩目的大数据公司Cloudera终于上市了,但市值表现令人大跌眼镜。 作为国外Hadoop三驾马车中体量最大、估值最高的公司,Cloud…

timg (6) 0

资源 | 自学数据科学&机器学习?19个数学和统计学公开课推荐

- 文章,数据分析 - 阅 463

在创造万物之前,上帝只是在做纯理论的数学。后来他想,做点应用数学应该是个有趣的变化。 ——数学家 John Edensor Littlewood 数学和统计学是数据科学和机器学习的基础。就我所知,大多数成功的数据科学家都来自这些领域——计算机科学、应用数学和统计学、经济学。如果你想掌…

2002ed2fc8da27ef504b8554efec6073ae8757dd202a1-6czNcO_fw658 0

我们用最全面、最仔细的数据,解析《速度与激情》

- 文章,数据分析 - 阅 720

文|彭博社 《速度与激情》系列重磅影片已经累计录得近14小时的总片长和40亿美元的总票房 《速度与激情8》将以一种观众已经为之疯狂、让片方赚得盆满钵满的语言继续讲述故事 到目前为止,《速度与激情》(Fast & Furious)系列重磅影片已经累计录得近14小时的总片长和40…

wKioL1jrABbw-AIhAAC7zvzI3-s266.jpg-wh_651x-s_2968870554 0

今日头条王烨:真正数据驱动的公司是这样使用数据的

- 文章,数据分析 - 阅 861

在前往今日头条的路上,一直考虑对于这样一家数据驱动的公司,访问哪个方向会更受关注,是个性化新闻推荐、不同业务之间算法差异,还是敏感信息屏蔽、新闻源抓取?可是,在这个阳光温暖的午后,与今日头条基础数据平台架构师王烨长达一个多小时的交流中,我们的话题不知不觉一直…