数盟 | Page 382
t0102f7a12bbe453034 0

推荐系统绝对不会向你推荐什么

- 1,759 次阅读 - 未分类

原作者: Joseph A. Konstan & John Riedl 推荐系统还有另外两大特点,也对你最终看到的推荐结果有着显著的影响:第一,在弄清楚你和其他购物者的相似度有多高之前,推荐系统必须先弄明白你真正喜欢什么;第二,推荐系统依照一组商业规则运行,以确保推荐结果既让你觉得有…

00144 0

NoSQL详解:如何找到对的技术

- 3,060 次阅读 - 基础架构

虽然关系型数据库系统RDBMS在安装和使用上仍然占有主要地位,但毋庸置疑,非关系型数据库NoSQL技术已经成为今天发展最快的数据库技术。 NoSQL是对数据库系统的总称,在某种程度上,它的性能和用途可能完全不同。NoSQL一词最早产生于上世纪九十年代,意思是No SQL(没有SQL语言…

t014f06d3b1a6ecd573 0

大数据应用:双色球算奖平台总体设计数据规模估算篇

- 1,952 次阅读 - 未分类

引子:什么才算大数据? 自从写了上一篇《大数据应用之双色球算奖平台总体设计大纲篇一》,受到许多园友的关注和指导,在此表示感谢,尤其是园友个人知识管理给出的一个评论,让我深思,原文如下“双色球算奖这么简单的活,也称大数据。先生:不是数据多,叫大数据。双色球算奖…

6941baebgw1er8gho646ej20r40bo778 0

用 LDA 做主题模型:当 MLlib 邂逅 GraphX

- 7,802 次阅读 - 文章,基础架构

主题模型可以从一系列文章中自动推测讨论的主题。这些主题可以被用作总结和整理文章,也可以在机器学习流程的后期阶段用于特征化和降维。 在Spark 1.3中,MLlib现在支持最成功的主题模型之一,隐含狄利克雷分布(LDA)。LDA也是基于GraphX上构建的第一个MLlib算法。在这篇博文…

QQ截图20150421185715 0

Spark Streaming和Kafka整合开发指南

- 22,047 次阅读 - 文章

Apache Kafka是一个分布式的消息发布-订阅系统。可以说,任何实时大数据处理工具缺少与Kafka整合都是不完整的。本文将介绍如何使用Spark Streaming从Kafka中接收数据,这里将会介绍两种方法:(1)、使用Receivers和Kafka高层次的API;(2)、使用Direct API,这是使用低层次的Ka…

640 0

文金言:透过美国的大数据战略布局,我们能看出什么

- 2,718 次阅读 - 未分类

我们正在经历一场由大数据引发的社会革命。人类生活中的一切活动,每次购买,每次对话,每次社交,每次移动,甚至我们的身份和身体的变化都成为信息收集、存储、分析和使用的对象。多样化的数据、巨大的数据量以及它们潜在的商业价值已经开始对社会经济和公民隐私产生深远的影响…

t017dd6649adbba916b_副本 0

华为诺亚方舟实验室主任李航访谈:用漂亮的方式解决”污浊”的问题

- 2,798 次阅读 - 人工智能

李航,华为技术有限公司诺亚方舟实验室主任,北京大学、南京大学兼职教授。他从日本京都大学电气工程系毕业,任东京大学计算机科学博士。曾就职于日本NEC公司中央研究所,任研究员,以及微软亚洲研究院,任高级研究员与主任研究员。李航博士的研究方向包括信息检索,自然语言处理…

t015e48b0d7aeaef11f 0

Amazon Web开展机器学习服务,用户可在云端学习预测模型

- 2,297 次阅读 - 未分类

Amazon Web服务最近启动了一项机器学习的服务,使用户可以在云端学习预测模型了。主流云服务供应商中的Google和微软分别推出了预测API和Azure机器学习的项目,,Amazon在最近也紧随其后开展了类似的服务。 该服务目前提供的学习模型与应用于许多大规模学习应用的模型相似,而…