编程语言 | 数盟社区 | Page 40
1459208296 0

海纳百川 有容乃大:SparkR与Docker的机器学习实战

- 编程语言 - 阅 1,615

题图为美国尼米兹核动力航空母舰 介绍 大数据时代,我们常常面对海量数据而头疼。作为学统计出身的人,我们想折腾大数据但又不想学习Hadoop或者Java,我们更倾向于把精力放在建模和算法设计上,SparkR和Docker的完美结合,让R的计算直接从一架战斗机的当兵作战华丽转变为一…

spark-1-777x417 0

【投稿】Spark知识体系完整解读

- 编程语言 - 阅 1,725

作者简介:杨思义,男,26岁,2015年6月毕业于山东大学齐鲁软件学院,工程硕士学位。 2014年6月至今工作于北京亚信智慧数据科技有限公司 BDX大数据事业部,从2014年9月开始从事项目spark相关应用开发。 Spark简介 Spark是整个BDAS的核心组件,是一个大数据分布式编程框…

wKioL1b4mJDAWaKYAANYottscM4981.jpg-wh_651x-s_3709087248 0

不同Hadoop上的SQL数据库引擎如何适配BI工作

- 编程语言 - 阅 1,599

来源:http://developer.51cto.com/art/201603/507931.htm 出处:http://www.36dsj.com/archives/45003 注:Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。 Hadoop上的SQL引擎Impala是一种新型查询系…

150714js6na77ddnozha7o 0

Rust语言入门、关键技术与实战经验

- 编程语言 - 阅 1,418

原文链接:炼数成金 唐刘,PingCAP 首席架构师,现致力于下一代分布式数据库 TiDB、分布式存储 TiKV  的开发。开源爱好者,Go、Rust 等语言爱好者和实  践者。 大家好,我是 PingCAP 的唐刘,今天很荣幸跟大家来分享一下 Rust 相关知识以及我们团队使用 Rust 的实战经验。 …

coding 0

2016年3月编程语言排行榜:与十年前相比前十名并无变化

- 编程语言 - 阅 1,862

原文链接:51CTO 无论软件行业发展的怎样迅速,编程语言始终没有多大变化,这似乎是一个例外的现象。如果我们把当前TIOBE排行榜前十名和10年前的相比,其包含的是完全相同的编程语言!唯一的不同在于:其中Visual Basic、PHP和Perl与同为十大热门却更现代的C#、Python和JavaScr…

wKioL1TQKA-QRFy8AAC04kTKnD4848 0

弗雷斯特研究公司:十大最热门的大数据技术

- 编程语言 - 阅 1,263

原文链接:InfoQ 随着大数据分析市场的快速渗透到各行业务,哪些大数据技术是刚需?哪些技术有极大的潜在价值? 根据发布的指数,这里给出最热的十个大数据技术: 预测分析:随着现在硬件和软件解决方案的成熟,许多公司利用大数据技术来收集海量数据、训练模型、优化…

211145qkl3833gl3o323ms 0

数盟译文–如何使用R语言的Boruta包进行特征选择

- 编程语言 - 阅 4,736

本文为数盟原创译文,转载时请务必注明出处为“数盟社区”,并将原文链接置于文首。 作者 Debrati 引言 变量选择是模型构建的一个重要方面,每个分析人员都必须学习。毕竟,它有助于排除相关变量、偏见和不必要噪音的限制来建立预测模型。 许多分析新手认为,保持所有…

201602064961454723924843 1

用Python写一个简单的微博爬虫

- 编程语言 - 阅 3,675

文/语亮(简书作者) 原文链接:http://www.jianshu.com/p/7c5a4d7545ca 我是个微博重度用户,工作学习之余喜欢刷刷timeline看看有什么新鲜事发生,也因此认识了不少高质量的原创大V,有分享技术资料的,比如好东西传送门;有时不时给你一点人生经验的,比如石康;有高产…