文章 | 数盟社区 | Page 283
20150107153034901 0

Image classification with deep learning常用模型

- 人工智能 - 阅 4,005

作者:Rachel-Zhang 本文中,我会根据下大家image classification常用的cnn模型,针对cifar10(for 物体识别),mnist(for 字符识别)& ImageNet(for 物体识别)做一个model 总结。 本文不讲coding(coding请见Convolution Neural Network (CNN) 原理与实现篇) …

t01886f95d10f843888 0

许鹏:Standalone部署模式下临时文件的生成和清除

- 基础架构 - 阅 2,368

概要 Spark运行过程中资源的申请和释放一直是源码分析时需要关注的重点,从资源种类上来说,有CPU、内存、网络、磁盘,其中前三者会在进程退出时由OS来负责释放。而占用的磁盘资源,如果Spark自身不及时的清理,就势必会造成文件的堆积,直至磁盘被占满不可用。 因此有必要弄…

t011ad3d51a39fbc509 0

如何在Hadoop 2.0上实现深度学习?

- 基础架构,人工智能 - 阅 4,262

位于波士顿的数据科学团队正在利用前沿的工具和算法,通过对用户数据的分析来优化业务行为。 数据科学很大程度上依赖机器算法,它能帮助我们发现数据的特征。要想洞察互联网般规模的数据还是很有挑战的,因此能够大规模的运行算法成为了我们的关键需求。随着数据的爆炸性增长,以…

t01aeac7d28365db9d5 0

流式大数据处理的三种框架:Storm,Spark和Samza

- 文章,基础架构 - 阅 4,247

许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。 Apache Storm 在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控…

t01c4df50ef16b7e14f 0

一共55个,盘点最实用的大数据可视化分析工具

- 数据分析 - 阅 2,289

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的…

225820safwbbaozi7ci7fw 0

MongoDB 3.0正式发布,支持多存储引擎

- 基础架构 - 阅 2,731

作者 谢丽 MongoDB 3.0正式发布,更新主要涉及存储引擎、备份集、分片集群和安全。 MongoDB 3.0的默认存储引擎仍然是MMAPv1,但除了增加集合级锁改进并发和更改部分设置支持多存储引擎外,它还更改了记录分配行为。该版本不再使用动态记录分配策略,并弃用了paddingFac…

t01fe2ff1cfe67ba593 1

[干货] 如何制作信息图(21页PPT)

- 可视化 - 阅 3,217

信息图,是用图片交流 设计,旨在使得与读者的交流尽可能的简单明了 信息图是“信息”与“图形设计”的有机结合,提供的是一种“视觉学习” 设定好目的、听众和时间安排 决定投入:预算、数据、工作量和时间 充分使用“符号”和“象征/比喻” 这样的个人简历,是不是很…

350px-Gradient_descent.svg_副本 0

机器学习中导数最优化方法(基础篇)

- 人工智能 - 阅 6,452

作者:daniel-D 1. 前言 熟悉机器学习的童鞋都知道,优化方法是其中一个非常重要的话题,最常见的情形就是利用目标函数的导数通过多次迭代来求解无约束最优化问题。实现简单,coding 方便,是训练模型的必备利器之一。这篇博客主要总结一下使用导数的最优化方法的几个基本方…