文章 | 数盟社区 | Page 234
t018c7cc2064b003d6f 0

在大规模系统中使用Scala

- 文章 - 阅 1,602

作者 Dave Hrycyszyn ,译者 邵思华  出处:infoq 本文是关于在大规模数据储存及分析系统中使用Sacla系列文章中的第一篇。 在过去几年间,已经有多个项目使用了Scala进行大规模数据储存及分析平台的设计。 BBC在设计公司内部的RDF数据储存系统时就使用了Scala以及Scalatra…

t01d339c0695cc4ae9d_副本 0

奇点理论是关于人工智能的科学理论,还是垃圾科学?

- 人工智能 - 阅 2,780

转载自:微信公众号_中国计算机学会(gh_2ac5be7fb69b) 来源:《中国计算机学会通讯》第6期《专栏》 作者: 王威廉 今年1月,一位叫蒂姆·厄本的政治学本科毕业生在其商业推广博客上发表了一篇题为《人工智能革命:通往超级智能的道路》的文章。2月,这篇文章旋即被翻译成中…

170742kkkrm5nm0bn70nz1_副本 0

对“在线学习行为”可能应用方向的分析建模及挖掘

- 数据分析 - 阅 2,670

在日趋精密数字技术条件下,学习模式已通过互联网、社会化媒体实现数字化。海量的学习信息以数据的形式蕴含着学习者的隐性行为特征。文章从数据挖掘与领域应用、学习行为及行为分析、网络行为分析模型三个角度对在线学习行为可能的应用方向进行综述研究,探讨学习者的在线学习行…

t01b2310cb32b7a5bd9_副本 0

实时处理日均50亿会话,解析Twitter Answers的架构

- 文章 - 阅 1,629

出处:炼数成金 去年我们发布了Answers,至今移动社区产生了惊人的使用量,让我们感到兴奋不已。现在Answers每天处理50亿次会话,并且这个数量在持续增加。上亿设备每秒向Answers端点发送数以百万计的请求。在你已经阅读到此处的这段时间里,Answers后台收到并处理了一千万次…

data-science-war_副本 0

数据科学界华山论剑:Python 与 R 巅峰对决

- 文章 - 阅 2,397

文章出处:大数据文摘 如果你是数据分析领域的新兵,那么你一定很难抉择——在进行数据分析时,到底应该使用哪个语言,R还是Python?在网络上,也经常出现诸如“我想学习机器语言,我应该用哪个编程语言”或者“我想快速解决问题,我应该用R还是Python”等这类问题。尽管两个编程语…

t01a780bac23b552114 0

推荐系统相关算法:SVD

- 文章 - 阅 1,694

作者:风中之炎  出处:风中之炎的博客 1. SVD简介 假如要预测Zero君对一部电影M的评分,而手上只有Zero君对若干部电影的评分和风炎君对若干部电影的评分(包含M的评分)。那么能预测出Zero君对M的评分吗?答案显然是能。最简单的方法就是直接将预测分定为平均分。不过这时的准…

t0123c56de49c9c3de9_副本 0

Kafka设计解析(三):Kafka High Availability (下)

- 文章 - 阅 1,521

作者 郭俊  出处:infoq Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。InfoQ一直在紧密关注Kafka的应用以及发展,“Kafka剖析”专栏…

QQ截图20150608192553_副本 0

用Apache Spark进行大数据处理:Spark SQL

- 文章 - 阅 1,636

作者 Srini Penchikala ,译者 丛一  出处:infoq 在Apache Spark文章系列的前一篇文章中,我们学习了什么是Apache Spark框架,以及如何用该框架帮助组织处理大数据处理分析的需求。 Spark SQL,作为Apache Spark大数据框架的一部分,主要用于结构化数据处理和对Spark数据…