文章 | 数盟 | Page 346
t01e3ec21c3f82a7fb2 0

基于分布式云的机器学习

- 人工智能 - 阅 1,698

这篇文章由微软云与信息服务实验室(CISL)和微软研究院(Microsoft Research)的研究员Dhruv Mahajan,Sundararajan Sellamanickam和Keerthi Selvaraj撰写。 三百六十行,行行出数据。从有关用户行为的记录,到系统的访问,还有使用模式等等。使用像微软Azure这样的云服务平…

py_thumb_副本 0

6个Python性能优化技巧

- 编程语言 - 阅 3,063

译者:dwqs Python是一门非常酷的语言,因为很少的Python代码可以在短时间内做很多事情,并且,Python很容易就能支持多任务和多重处理。 Python的批评者声称Python性能低效、执行缓慢,但实际上并非如此:尝试以下6个小技巧,可以加快Pytho应用程序。     1…

345 0

菜鸟也能玩转大数据:Airbnb开源Presto数据库SQL工具

- 基础架构 - 阅 3,424

作者:Cashcow 旅游房屋短租网站Airbnb近日开源了一款SQL工具——Airpal,使普通员工也能够用Hadoop系统分析大数据。 Airpal是Airbnb一年前就已经开发并使用的Presto数据查询工具,通过Airpal的设计宗旨是降低数据查询门槛,通过可视化界面等使不同部门的业务人员也能轻松…

t012c0cdcc0a0674c8f 0

SQL的几种连接:内连接、左联接、右连接、全连接、交叉连接

- 基础架构 - 阅 10,970

作者:初行 – 博客园 SQL连接可以分为内连接、外连接、交叉连接。 数据库数据: book表:                                         stu表:                            1.内连接 1.1.等值连接:在连接条件中使用等于号(=)运算符比较被连接列的列值,其…

075 0

数据可视化常用的五种方式及案例分析

- 可视化 - 阅 3,605

因为接下来要做卖家后台数据纵横的改版,对数据可视化这块儿又进行了研究和心得的整理,跟大家分享下数据可视化常用的五种方式,希望能给大家带来思路的拓展。 概念 借助于图形化的手段,清晰、快捷有效的传达与沟通信息。从用户的角度,数据可视化可以让用户快速抓住要点…

20150107153034901 0

Image classification with deep learning常用模型

- 人工智能 - 阅 4,340

作者:Rachel-Zhang 本文中,我会根据下大家image classification常用的cnn模型,针对cifar10(for 物体识别),mnist(for 字符识别)& ImageNet(for 物体识别)做一个model 总结。 本文不讲coding(coding请见Convolution Neural Network (CNN) 原理与实现篇) …

t01886f95d10f843888 0

许鹏:Standalone部署模式下临时文件的生成和清除

- 基础架构 - 阅 2,602

概要 Spark运行过程中资源的申请和释放一直是源码分析时需要关注的重点,从资源种类上来说,有CPU、内存、网络、磁盘,其中前三者会在进程退出时由OS来负责释放。而占用的磁盘资源,如果Spark自身不及时的清理,就势必会造成文件的堆积,直至磁盘被占满不可用。 因此有必要弄…

t011ad3d51a39fbc509 0

如何在Hadoop 2.0上实现深度学习?

- 基础架构,人工智能 - 阅 5,615

位于波士顿的数据科学团队正在利用前沿的工具和算法,通过对用户数据的分析来优化业务行为。 数据科学很大程度上依赖机器算法,它能帮助我们发现数据的特征。要想洞察互联网般规模的数据还是很有挑战的,因此能够大规模的运行算法成为了我们的关键需求。随着数据的爆炸性增长,以…