数据挖掘 | 数盟 | Page 7
wKiom1mRgqqSJWNvAAMNCq-dWcE562.jpg-wh_651x-s_3257577405 0

美团R语言数据运营实战

- 文章,数据分析,数据挖掘 - 阅 383

一、引言 近年来,随着分布式数据处理技术的不断革新,Hive、Spark、Kylin、Impala、Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益成为各类企业和机构的标配。在这种背景下,是否能探索和挖掘数据价值,具备精细化数据运营的能力,…

ce5fd91f344ec130f6f42ec265c51839.jpeg-wh_651x-s_2415570986 0

6 大最流行、最有用的自然语言处理库对比

- 文章,数据分析,数据挖掘 - 阅 358

现在自然语言处理(NLP)变得越来越流行,这在深度学习发展的背景下尤其引人注目。NLP 是人工智能的一个分支,旨在从文本中理解和提取重要信息,进而基于文本数据进行训练。NLP 的主要任务包括语音识别和生成、文本分析、情感分析、机器翻译等。 近几十年,只有适当受过语言…

cca94a6d20d60c1c7b10e44216a873cb.jpg-wh_651x-s_179035833 0

大数据迁徙图:逃离北上广,他们竟然去了这里!

- 文章,数据分析,数据挖掘 - 阅 311

“做出这个决定,我们考虑了很久。”不久前,高铭离开了工作生活12年的北京,举家回到故乡重庆。“重庆房价比北京便宜得多,孩子上学的问题也好解决。” 高铭的经历并非个案。最近几年,“逃离北上广”成为经久不衰的热门话题。除了高房价和子女教育问题,逃离理由还有雾霾引发的健康…

timg (3) 0

尴尬了,数据故事讲不好,模型再酷炫都没用

- 文章,数据分析,数据挖掘 - 阅 333

导言:数据科学风靡了几年,已经完成了从普及到应用的商业落地,越来越多的公司都已经同意数据驱动战略的重要性,但雇几个数据科学家和有一个数据团队,并不等同于公司就能坐享数据科学的果实。 数据科学家慢慢发现在科研阶段引以为豪的高端模型,在向没有技术背景的管理层做展…

图片1 0

DQMIS 2018:聚焦“数据质量”,产学研企精英汇聚探讨中国大数据的下一个风口

- 文章,数据分析,数据挖掘,合作会议 - 阅 312

引言:这可能是中国首个以“数据质量”为主题的精专峰会。 在大数据时代, 数据质量问题成为影响数据分析和利用效能的“最后一公里”问题, 是困扰许多大数据公司和企业在拓展其大数据战略不可回避的问题。目前在数据治理领域, ETL, 数据分析, 数据集成、数据可视化等领域已经…

u=3142028501,2084813239&fm=11&gp=0 0

从混沌到赋能,大数据如何影响世界?

- 文章,数据分析,编程语言,数据挖掘 - 阅 630

当今世界,数据无处不在,分析持续创新,数据背后挖掘出价值的多少直接影响企业乃至社会经济的增长速度。从各国层出不穷的数据创新案例来看,大数据红利正在加快释放。 大数据的发展已从“混沌状态”走向“赋能时代”。有关机构预测,2025年全球大数据规模将增长至163ZB,相当于2016…

20170724095946963 0

数据可视化常用的五种方式及案例分析

- 文章,数据分析,人工智能,数据挖掘 - 阅 364

概念借助于图形化的手段,清晰、快捷有效的传达与沟通信息。从用户的角度,数据可视化可以让用户快速抓住要点信息,让关键的数据点从人类的眼睛快速通往心灵深处。数据可视化一般会具备以下几个特点:准确性、创新性 和 简洁性。 常用五种可视化方法 下面从最常用和实用的维度…

235111-160RF6330464-2 0

Spark比拼Flink:下一代大数据计算引擎之争,谁主沉浮?

- 未分类,文章,数据分析,数据挖掘 - 阅 957

下一代大数据计算引擎 自从数据处理需求超过了传统数据库能有效处理的数据量之后,Hadoop 等各种基于 MapReduce 的海量数据处理系统应运而生。从 2004 年 Google 发表 MapReduce 论文开始,经过近 10 年的发展,基于 Hadoop 开源生态或者其它相应系统的海量数据处理已经成为业界…