编程语言 | 数盟社区 | Page 33
211145qkl3833gl3o323ms 0

如何在R中操作非结构化数据?

- 编程语言 - 阅 1,019

来源:炼数成金 介绍 现代化数据科学中的 DataFrame 概念源起R语言,而 Python Pandas 和 Spark DateFrame 都是参考R设计的。不过在实际的网络数据通讯中,类似DateFrame这样的格式却并不是主流,真正主流的方式其实是JSON(JavaScript Online Notation),所以讨论如何处…

559f93b9e37a7_middle 0

如何基于Spark进行用户画像?

- 编程语言 - 阅 1,796

来源:炼数成金 原文链接 http://it.dataguru.cn/article-9047-1.html 近期,comSysto公司分享了该公司研发团队利用Spark平台解决Kaggle竞赛问题的经历,为Spark等平台应用于数据科学领域提供了借鉴。   主办方提供了一个包含5万个匿名驾驶员线路的数据集,竞赛的…

476085727186380350 1

怎样在Python中操作Docker容器?

- 编程语言 - 阅 2,415

来源:EarlGrey    编程派本文由创业公司DeepGram的CTO Noah Shutty分享。DeepGram开放了自己的API,可以让开发者检索音频和视频文件中的语音信息。免费的开发者账号每月有40个小时的上传额度。为什么要这样做? Docker容器在分离不同应用方面做的非常出色,但是如果你想让…

1286954222997 0

架构师面试总结

- 基础架构,编程语言 - 阅 2,900

摘要 本文原创,转载请注明地址:http://kymjs.com/code/2016/03/08/01 “基础 Android 知识掌握的不错,学习能力也不错。但是基础知识部分比较薄弱,有些概念和逻辑掌握不清。” 感谢春林的这句话。 MVC,MVP 和 MVVM MVC 通信方式,环形方式: 1、View 传送指令到 Contro…

01200000008162114713823671442 0

Python开发:缓存机制介绍

- 编程语言 - 阅 1,386

核子可乐译 51CTO   【51CTO快译】在今天的文章中,我们将一同从简单示例出发,了解如何使用缓存机制。在此之后,我们将进一步利用Python标准库的functools模块创建适合自己需要的缓存。闲言少叙,马上开始。 缓存是一种将定量数据加以保存以备迎合后续请求的…

710886c517fe7f69b60c5b6f386fe651 2

R语言和 Python —— 一个错误的分裂

- 编程语言 - 阅 1,144

来源:开源中国  译者 无若, IdleMan, Kiss_, whatcq 最近有一些文章提出与年龄相关的问题:“崭露头角的年轻数据科学家们是学习R语言还是Python更好?" 答案似乎都是“视情况而定”,在现实中没有必要在R和Python中做出选择,因为你两个都用得到。 它被称为RPy2:http://rp…

1402553045-0 0

程序员必须知道的10大基础实用算法及其讲解

- 编程语言 - 阅 1,111

算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分…

wKioL1bfxj-SNq4qAAIg-VTTs-o438_jpg-wh_173x112-s_368855490 0

别再比较Hadoop和Spark了,那不是设计人员的初衷

- 编程语言 - 阅 1,732

云头条编译 对Hadoop与Spark孰优孰劣这个问题,最准确的观点就是,设计人员旨在让Hadoop和Spark在同一个团队里面协同运行。 直接比较Hadoop和Spark有难度,因为它们处理的许多任务都一样,但是在一些方面又并不相互重叠。 比如说,Spark没有文件管理功能,因而必须…