文章 | 数盟 | Page 399
t01a9bddfa2aa55631d 0

如何高效地将SQL数据映射到NoSQL存储系统中

- 基础架构 - 阅 2,046

作者 Sytze Harkema ,译者 邵思华 通常来说,我们都知道: SQL数据库只限在单机上运行,但它提供了更强的事务管理、schema与查询功能。 NoSQL数据库为了伸缩性与容错性的目的,放弃了事务管理与schema。 而FoundationDB的SQL层结合了这两个方面:它首先是一个开源的…

t01452b155117465ddb 0

数据可挖掘的知识类型:概念/类描述、关联模式、聚类分析…

- 数据分析 - 阅 7,970

一、概念/类 描述 概念/类描述就是通过对某类对象关联数据的汇总,分析和比较,用汇总的简洁的精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为:特征性描述和区别性描述。 特征性描述:是指从与某类对象相关的一组数据中提取出关于这些对…

t0120f6c5b3ff4c0f82_副本 0

机器学习中的相似性度量,方法汇总对比

- 人工智能 - 阅 4,266

作者:苍梧 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目录…

980658818877480394 0

3分钟上手的交互地图 – odyssey.js

- 可视化 - 阅 3,902

专为新闻记者也就是俗称小白用户提供的交互地图工具,快速提高你的Bigger。 第一,真的只用三分钟哦。 第二,我是小白哦。 第三,它真的挺好用哦。 odyssey.js是CartoDB发布的开源交互地图。【什么,你不知道CartoDB是什么?点击链接补补课吧。】平时看多了大神高大上…

54acd19a9598d_middle_副本 0

动手指南:使用Amazon Kinesis实现地理数据的实时可视化

- 可视化 - 阅 3,254

Amazon Kinesis是个用于大规模数据实时处理的完全托管服务。不管你是建立一个从远端传感器中收集数据的系统,还是打造一个在多个不同服务器上做日志收集的应用程序,亦或是建立最新的物联网(IoT)解决方案,Amazon Kinesis都可以满足你每个小时从成千上万个不同数据源收集和处理…

133402csjuqgmscxmqzqzo 0

Docker的8个应用场景

- 文章 - 阅 2,742

摘要: 在这篇文章中,我想介绍并分享一些Docker的实际应用案例。在我们讨论Docker的使用场景之前,先来看看Docker这个工具有什么特别的地方吧。Docker提供了轻量级的虚拟化,它几乎没有额外开销,这个特性非常酷。首先你可 ... 在这篇文章中,我想介绍并分…

0107001 0

存储系统设计中的不平衡原则

- 文章 - 阅 1,829

作者 李士窑 二八定律又名帕累托法则、不平衡原则等,它是一种不均匀分布的理论,已被广泛应用于社会学、企业管理学以及经济学中等。同样,该定律也适应于计算机科学领域,如应用负载、磁盘访问、存储系统设计等也都是不均匀的随机分布。近日,存储服务初创公司Coho Data的联…

123 0

将数据从PostgreSQL同步到Elasticsearch的经验总结

- 文章 - 阅 2,722

作者 李士窑 Elasticsearch是一款基于Apache Lucene构建的开源全文检索引擎,它能够轻松地进行大规模的横向扩展,以支撑PB级的结构化和非结构化海量数据的处理。而关系型数据库比较擅长对数据的管理,但对全文检索功能的支持相对不足,所以有时候一些实际项目需要将关系型数据…