数据分析 | 数盟社区
wKiom1VtBKqCKKFCAADJGQ7MJnU967 0

爬虫工程师如何绕过验证码?寻找阿登高地之路

- 文章,数据分析 - 阅 154

马奇诺防线是二战前法国耗时十余年修建的防御工事,十分坚固,但是由于造价昂贵,仅修建了法德边境部分,绵延数百公里,而法比边界的阿登高地地形崎岖,不易运动作战,且比利时反对在该边界修建防线,固法军再次并没过多防备,满心期望能够依靠坚固的马奇诺防线来阻挡德军的攻势…

1-15012311152CQ 0

谷歌用3亿张图做了个深度学习实验,结论:数据还是越大越好

- 文章,数据分析,深度学习 - 阅 173

都说深度学习的兴起和大数据息息相关,那么是不是数据集越大,训练出的图像识别算法准确率就越高呢? Google的研究人员用3亿张图的内部数据集做了实验,然后写了篇论文。他们指出,在深度模型中,视觉任务性能随训练数据量(取对数)的增加,线性上升。 以下是Google Research机…

1100 0

马云和小贝选谁做老公?写给非数据人的数据世界入门指南

- 文章,数据分析 - 阅 116

一. 一段经历,一点心得 一直追我博客的人想必是清楚我之前做交互设计,然后去轮岗过行业运营,然后突然就开始做产品经理了。我也觉得奇怪的是,上次发了一个招聘启事后,来加我微信的同学们,既有做交互的,也有做产品经理的,甚至还有在IBM做了5年BI数据分析师的……这样看…

1-71 0

如何写出一份思路清晰的竞品分析报告?

- 文章,数据分析 - 阅 156

文 | 爱合伙 互联网创业除了早期的市场调研外,竞品分析也是关键的一步。创业者市场调研的最终目的还是在开发产品上,所以,不妨研究现在市场上同行业领域做的比较出色的竞品,说不定可以找到产品故事的一些灵感,早期的产品开发一定要短小精炼,解决用户痛点的核心功能为主,至…

aa3f77264c11b3ad 1

解密 | 大数据治理需要具备哪些能力和关键技术?

- 数据分析,行业 - 阅 132

在企业数据建设过程中,大数据治理受到越来越多的重视。从企业数据资产管理和提升数据质量,到自服务和智能化的数据应用,大数据治理的内容在不断发展和完善,其落地实施的过程中会遇到各种各样的难题和挑战。本篇文章通过分析大数据治理建设中的沟沟坎坎,总结出了大数据治理需…

48f1d947885f21dc 0

行业 | 企业构建大数据分析体系的4个层级

- 数据分析,行业 - 阅 213

关于企业的大数据体系构建,可以分为4个层级,每个层级之间可以是递进的关系,虽然业务主导不同,但构建思路相通。 下面这张图,是本文的精华概括,接下来将一一展开与大家探讨。 一、数据基础平台 基础的数据平台建设工作,包含基础数据平台的建设,数据的规范,数据仓库的…

ca0a1b179103f03e419b24a4d170477f620e2df2210f8-l7VvPM_fw658 0

深度分析 | 你戒不掉王者荣耀是因为不懂

- 文章,数据分析 - 阅 296

本人作为一个深入农药坑中的患者,在某次连输几盘后,我的内心几乎是崩溃的。 但因为先前学过禅修的缘故,对自我状态比较敏感,在用观息法调整过程中,豁然醒悟,趁势“戒掉”。 为了帮助到广大类似我这样的玩家脱坑,这里分享下心得。 所谓知己知彼百战百胜,本文主要讲三个部…

wKiom1k1_lfj6BL9AAEzoqMzlNQ228.jpg-wh_651x-s_2724062054 0

Spark Streaming场景应用- Spark Streaming计算模型及监控

- 文章,数据分析 - 阅 259

摘要 Spark Streaming是一套优秀的实时计算框架。其良好的可扩展性、高吞吐量以及容错机制能够满足我们很多的场景应用。本篇结合我们的应用场景,介结我们在使用Spark Streaming方面的技术架构,并着重讲解Spark Streaming两种计算模型,无状态和状态计算模型以及该两种模型的注…