四月 | 2015 | 数盟社区
t0176be4cfb06cf050e 0

公安大数据系统应用现状解析

- 未分类 - 4,152 次阅读

作为互联网+的重要组成部分,行业大数据应用实践一向被产业所关注。与金融、医疗、电信、零售等行业大数据技术与实践不绝于耳的研讨相比,公安系统大数据的应用一向难以被大家所认知。直到最近听到某省公安厅科信处负责人,这位已经在公安信息系统中工作数十年的技术专家的深入分…

t01af29492e0179d94c 0

App运营者必须知道的30款数据分析工具

- 数据分析 - 19,138 次阅读

如今的移动应用早已不再是某种结构单一、功能简单的工具了。当我们的移动应用变得越来越庞杂,我们便会需要借用分析工具,来跟踪和分析App内的每一个部分。幸运的是,目前市面上有许多数据分析工具可供App开发团队选择。 事实上,这些新一代的数据分析工具,将可以监测发生在A…

t01d70908d99373bf24_副本 0

关联挖掘算法Apriori和FP-Tree学习,及算法实现

- 文章 - 2,629 次阅读

Apriori算法和FPTree算法都是数据挖掘中的关联规则挖掘算法,处理的都是最简单的单层单维布尔关联规则。 Apriori算法 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。是基于这样的事实:算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜索的迭代方法…

t0161144853eded9429 0

在机器学习方面使用 R + Hadoop 方案真的有那么好?

- 行业应用 - 4,043 次阅读

为什么有些公司在机器学习业务方面倾向使用 R + Hadoop 方案? 因为他们在不懂R和Hadoop的特征应用场景的情况下,恰好抓到了一根免费,开源的稻草。 R: R的应用场景不在于无与伦比的统计学习能力,而在于结构化数据下无与伦比的单位代码产出量。神经网络,决策树等基于…

34fe394aed2f4b7dc53cd7fbc7d3e472_副本 0

Python爬虫手把手系列(二):Urllib库的初高级使用

- 文章 - 7,243 次阅读

Python爬虫手把手系列(一)爬虫基础了解 那么接下来,小伙伴们就一起和我真正迈向我们的爬虫之路吧。 一、Urllib库的初级使用 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器…

34fe394aed2f4b7dc53cd7fbc7d3e472_副本 0

Python爬虫手把手系列(一)爬虫基础了解

- 文章 - 10,998 次阅读

大家好哈,最近博主在学习Python,学习期间也遇到一些问题,获得了一些经验,在此将自己的学习系统地整理下来,如果大家有兴趣学习爬虫的话,可以将这些文章作为参考,也欢迎大家一共分享学习经验。 Python版本:2.7,Python 3请另寻其他博文。 一、综述 首先爬虫是什么? …

t0190e9c0fe47acda38 0

Spark Streaming性能调优详解

- 基础架构 - 3,771 次阅读

Spark Streaming提供了高效便捷的流式处理模式,但是在有些场景下,使用默认的配置达不到最优,甚至无法实时处理来自外部的数据,这时候我们就需要对默认的配置进行相关的修改。由于现实中场景和数据量不一样,所以我们无法设置一些通用的配置(要不然Spark Streaming开发者就不…

t01a55b569440b27643 0

数据告诉你,百万年薪如何炼成

- 未分类 - 1,955 次阅读

Duang~又是一年毕业季,你拿到心仪的好offer了吗?即将毕业的你有没有很捉急呢? 究竟什么样的人才能拿到年薪百万的投行offer,他们能否胜任光鲜而残酷的投行环境呢?快来看吧! 本报告的样本来自有这些投行工作经历并在大陆及香港办公室工作的LinkedIn用户数据。 1、教育…