文章 | 数盟 | Page 399
QQ截图20141202225217 0

基于地图讲述新闻事件可视化项目(功能篇)

- 文章 - 阅 1,916

作者:李志才 项目介绍 该可视化项目是将新闻事件按地理位置映射的地图上,让浏览者非常直观的了解事件发生地、影响的区域等信息。通过点击地图区域的标注点可以了解当前位置的新闻事件。 引导界面 引导界面分为地图区域、封面区域、引导区域。 地图区域: …

0 0

最近很火的“微笑传递”背后的数据分析

- 数据分析 - 阅 2,296

“微笑挑战”最近火了:左边放上点名者照片,右边放上自己的微笑,再点十个人……这不就是趁机晒自拍嘛! 更有(洋葱)新闻犀利指出:【女生都会选比自己丑的朋友——点你是因为你没我好看哦……】还能不能好好做朋友啦!? ——别怕,科学青年来教你自拍了! (Jia-Bin Huang)为…

wKioL1R7ylaAshq8AACMO_njaGQ815 0

10 款最好的 Python IDE

- 编程语言 - 阅 3,556

Python 非常易学,强大的编程语言。Python 包括高效高级的数据结构,提供简单且高效的面向对象编程。 Python 的学习过程少不了 IDE 或者代码编辑器,或者集成的开发编辑器(IDE)。这些 Python 开发工具帮助开发者加快使用 Python 开发的速度,提高效率。高效的代码编辑器或…

5477dfa015946 0

人工智能和机器学习领域有哪些有趣的开源项目?

- 人工智能 - 阅 4,372

本文简要介绍了10款   Quora上网友推荐的 人工智能和机器学习领域方面的开源项目。 GraphLab GraphLab是一种新的面向机器学习的并行框架。GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以分析产品,该公司客户包括Zillow、Adobe、Zynga、…

123 2

【精】从入门到高深,史上最全的Spark综合帖

- 基础架构 - 阅 39,264

什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地…

spark_debug 0

Spark作业代码(源码)IDE远程调试

- 基础架构 - 阅 4,867

我们在编写Spark Application或者是阅读源码的时候,我们很想知道代码的运行情况,比如参数设置的是否正确等等。用Logging方式来调试是一个可以选择的方式,但是,logging方式调试代码有很多的局限和不便。今天我就来介绍如何通过IDE来远程调试Spark的Application或者是Spark的源…

u=4003614593,1969300835&fm=15&gp=0 0

Spark SQL深度理解篇:模块实现、代码结构及执行流程总览

- 基础架构 - 阅 5,545

在2014年7月1日的Spark Summit上,Databricks宣布终止对Shark的开发,将重点放到Spark SQL上。Spark SQL将涵盖Shark的所有特性,用户可以从Shark 0.9进行无缝的升级。日前张包峰的博客上分享了Spark SQL各个模块的实现情况、代码结构、执行流程以及对Spark SQL的理解。 以下为原…

u=1535546616,4148789559&fm=15&gp=0 0

Spark源码分析:多种部署方式之间的区别与联系

- 基础架构 - 阅 5,743

作者:过往记忆 从官方的文档我们可以知道,Spark的部署方式有很多种:local、Standalone、Mesos、YARN…..不同部署方式的后台处理进程是不一样的,但是如果我们从代码的角度来看,其实流程都差不多。 从代码中,我们可以得知其实Spark的部署方式其实比官方文档中介绍的还要多,…