数盟 | Page 553
471e9e 0

深入浅出解析大数据平台架构

- 4,840 次阅读 - 未分类

 大数据的4V特征-来源 公司的“大数据” 随着公司业务的增长,大量和流程、规则相关的非结构化数据也爆发式增长。比如: 1、业务系统现在平均每天存储20万张图片,磁盘空间每天消耗100G; 2、平均每天产生签约视频文件6000个,每个平均250M,磁盘空间每天消耗1T; …

8cb3137f 0

十八款Hadoop工具帮你驯服大数据

- 3,221 次阅读 - 基础架构

Hadoop已经通过自身的蓬勃发展证明,它不仅仅是一套用于将工作内容传播到计算机群组当中的小型堆栈--不,这与它的潜能相比简直微不足道。这套核心的价值已经被广泛证实,目前大量项目如雨后春笋般围绕它建立起来。有些项目负责数据管理、有些负责流程监控、还有一些则提供先进的…

BFBE 0

数据可视化的七个秘密

- 2,353 次阅读 - 可视化

数据可视化,特别是基于Web的数据可视化的时代已经到来了。 类似JavaScript的可视化库如D3.js, Raphaël, 以及Paper.js, 以及最新浏览器所支持的如Canvas和SVG,以及使得那些过去只能由计算机专家和专业设计人员开发的复杂的可视化变得越来越简单了。 数据可视化如今成为了很多…

194 0

大数据营销之十大杀手锏

- 1,580 次阅读 - 未分类

许多人感觉到大数据时代正在到来,但往往只是一种朦胧的感觉,对于其真正对营销带来的威力可以用一个时髦的词来形容——不明觉厉。实际上,还是应尽量弄明白,才会明白其厉害之处。对于多数企业而言,大数据营销的主要价值源于以下几个方面。 第一,用户行为与特征分析。显然,…

EF4D 0

大数据,拼的就是速度!

- 1,984 次阅读 - 未分类

开源工具正帮助企业大量处理数据流,而为了引入复杂查询与事务型处理能力,VoltDB公司的John Hugg建议采用内存内NewSQL数据存储模式。 大数据之所以能够坐拥一个“大”字,主要依靠源源不断且态势稳定的输入数据流。在大容量环境之下,数据的积累速度往往十分惊人,不过其分析与存…

538 0

从Storm和Spark 学习流式实时分布式计算的设计

- 4,294 次阅读 - 基础架构

背景 最近我在做流式实时分布式计算系统的架构设计,而正好又要参见CSDN博文大赛的决赛。本来想就写Spark源码分析的文章吧。但是又想毕竟是决赛,要拿出一些自己的干货出来,仅仅是源码分析貌似分量不够。因此,我将最近一直在做的系统架构的思路整理出来,形成此文。为什么要参…

e6bb 0

十种程序语言帮你读懂大数据的“秘密”

- 2,032 次阅读 - 未分类

摘要:经过数年发展,当下大数据领域已充斥着各种各样的分析工具,那么如何才能选择自己适合的。本文从R、Scala、Java、Go、Python等10种语言着手,带大家一览大数据领域的常用工具。 【编者按】面对成千上万条数据记录,你是否在焦虑没有找到一种快捷而又精准的方式进行处理呢…

ddle 0

Redis错误配置详解

- 2,602 次阅读 - 基础架构

摘要:在使用Redis做缓存时,应用往往能得到非常高的性能。然而,如果配置不当,你将遇到很多令人头疼的问题,比如复制缓冲区限制、复制超时等。 【编者按】笔者在运行了上千个Redis数据库实例后,不仅发现了使用Redis时遇到的一些令人头疼的问题,更是探索到了解决这些问题的简…