基础架构 | 数盟 | Page 38
t0196e1c428a2e932a3_副本 0

使用Apache Hadoop、Impala和MySQL进行数据分析

- 数据分析,基础架构 - 阅 2,919

作者 孙镜涛 Apache Hadoop是目前被大家广泛使用的数据分析平台,它可靠、高效、可伸缩。Percona公司的Alexander Rubin 最近发表了一篇博客文章介绍了他是如何将一个表从MySQL导出到Hadoop然后将数据加载到Cloudera Impala并在这上面运行报告的。 在Alexander Rubin的这个…

20141222134630106_副本 0

Spark 1.2 发布,开源集群计算系统,新特性概述如下

- 基础架构 - 阅 2,596

作者:陈超 Spark 1.2 发布,此版本包括 172 位贡献者和超过 1000 个 commits。 此版本包括 Spark 核心操作和性能改进; 添加新的网络传输子系统,进行了较大的改进; Spark SQL 引入了一个外部数据源的支持,支持 Hive13; 动态分区; fixed-precision decima…

t013aec7b965885e254_副本 0

Apache Sqoop:云端大数据分析的关键一环

- 基础架构 - 阅 2,342

  Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据移植过去并不容易。Apache Sqoop正在加紧帮助客户将重要数据从数据库移到Hadoop。 正当大数据变得越来越重要,而越来越多应用都在云上部署时,云管理员也面临了不断增长的将数据从源系统转移到分析系统——其中…

t01a05c982673cf06f8 0

12款免费与开源的NoSQL数据库介绍

- 基础架构 - 阅 2,002

作者:张龙 Naresh Kumar是位软件工程师与热情的博主,对于编程与新事物拥有极大的兴趣,非常乐于与其他开发者和程序员分享技术上的研究成果。近日,Naresh撰文谈到了12款知名的免费、开源NoSQL数据库,并对这些数据库的特点进行了分析。 现在,NoSQL数据库变得越来越流行…

t01aa61c750412bdc26 0

网易大数据平台的Spark技术实践

- 基础架构 - 阅 3,862

作者 王健宗 网易的实时计算需求 对于大多数的大数据而言,实时性是其所应具备的重要属性,信息的到达和获取应满足实时性的要求,而信息的价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客的点击行为分析其购买意愿,做到精准营销。 实…

t0148ef482b7367408e_副本 0

python 读写Oracle10g数据简介

- 基础架构,编程语言 - 阅 2,538

作者:Panblack 1、测试环境: Centos6 X86_64 python 2.6 Oracle 10g 2、安装cx_Oracle 和 Oracle InstantClient: http://www.rpmfind.net/linux/rpm2html/search.php?query=cx_oracle http://www.oracle.com/technetwork/database/features/instant-client/inde…

t011add6b360a5da2eb 0

Python抓取Excel表数据至MySQL表

- 基础架构,编程语言 - 阅 5,342

作者:临座城池 [crayon-5b08255fef547685445941/] 具体的说明和细节,请看源码中的注释。   文章出处:临座城池的博客

0715010 0

HBase高性能复杂条件查询引擎

- 基础架构 - 阅 2,760

作者:耿立超 写在前面 在这次的审稿过程中有幸得到了Ted Yu和梁堰波先生的反馈,大家就一些感兴趣的内容进行了讨论。该方案由一个智能交通解决方案演变而来,设计之初仅寄希望于通过二级索引提升查询性能,由于在前期架构时充分考虑了通用性以及对复杂条件的支持,在后来的演…