数据挖掘 | 数盟 | Page 8
20180620030609255 0

不要让数据科学成为一场骗局

- 文章,数据分析,编程语言,数据挖掘 - 阅 468

现在的公司热衷于将数据科学视为点石成金的魔法,垂涎数据科学将带来的革命性成果,争相追随科技巨头,并翘首以待。他们重金聘请价格不菲的数据科学家和机器学习工程师,斥巨资投入到软件和硬件上,并花了很多时间畅想美好的未来。然而,尽管付出了这么多的努力和金钱,很多公司…

3b622c11d2d59fa5f2a07304cdb43b3a.jpg-wh_651x-s_1232093187 0

通过机器学习和时间序列数据理解软件系统行为

- 文章,数据分析,人工智能,数据挖掘,深度学习 - 阅 391

关键要点 • 在深入了解使用机器学习来了解软件系统行为之前,必须先了解传统的时间序列方法。 • 时间序列数据的值缺失可能会在分析时导致意外结果,Pandas库可以帮为你填充合理的默认值。 • 当人们在使用你的服务时,你应该期望数据具有季节性。在设计预测算法时要考虑到这一…

ce5fd91f344ec130f6f42ec265c51839.jpeg-wh_651x-s_2415570986 0

最详细大数据项目落地路线图实践总结

- 文章,数据分析,数据挖掘 - 阅 590

今天,来谈一谈 " 大数据项目如何落地?" 这个话题。从事过多个大数据项目的规划方案及项目落地工作,在这里与大家分享一些心得,主要是关于大数据项目如何成功落地并取得预期目标,也可以说这些是实践出来的观点。 对于一个大数据应用项目 / 产品的落地,可以大致总结为五大步骤…

20180808093825481 0

数据科学中模型可解释性差?你考虑了各种不确定性了吗?

- 文章,数据分析,数据挖掘 - 阅 396

本文作者是来自 Taboola 的数据科学家 Inbar Naor,她的研究领域是探索深度学习在推荐系统中的应用,在本文作者介绍了数据科学中模型不确定性的问题,并探索了如何利用不确定性来调试模型。 当深度神经网络(DNN)变得越来越强大的时候,它们的复杂性也在一并与日俱增,而这种…

wKiom1mRgqqSJWNvAAMNCq-dWcE562.jpg-wh_651x-s_3257577405 0

美团R语言数据运营实战

- 文章,数据分析,数据挖掘 - 阅 440

一、引言 近年来,随着分布式数据处理技术的不断革新,Hive、Spark、Kylin、Impala、Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益成为各类企业和机构的标配。在这种背景下,是否能探索和挖掘数据价值,具备精细化数据运营的能力,…

ce5fd91f344ec130f6f42ec265c51839.jpeg-wh_651x-s_2415570986 0

6 大最流行、最有用的自然语言处理库对比

- 文章,数据分析,数据挖掘 - 阅 416

现在自然语言处理(NLP)变得越来越流行,这在深度学习发展的背景下尤其引人注目。NLP 是人工智能的一个分支,旨在从文本中理解和提取重要信息,进而基于文本数据进行训练。NLP 的主要任务包括语音识别和生成、文本分析、情感分析、机器翻译等。 近几十年,只有适当受过语言…

cca94a6d20d60c1c7b10e44216a873cb.jpg-wh_651x-s_179035833 0

大数据迁徙图:逃离北上广,他们竟然去了这里!

- 文章,数据分析,数据挖掘 - 阅 350

“做出这个决定,我们考虑了很久。”不久前,高铭离开了工作生活12年的北京,举家回到故乡重庆。“重庆房价比北京便宜得多,孩子上学的问题也好解决。” 高铭的经历并非个案。最近几年,“逃离北上广”成为经久不衰的热门话题。除了高房价和子女教育问题,逃离理由还有雾霾引发的健康…

timg (3) 0

尴尬了,数据故事讲不好,模型再酷炫都没用

- 文章,数据分析,数据挖掘 - 阅 406

导言:数据科学风靡了几年,已经完成了从普及到应用的商业落地,越来越多的公司都已经同意数据驱动战略的重要性,但雇几个数据科学家和有一个数据团队,并不等同于公司就能坐享数据科学的果实。 数据科学家慢慢发现在科研阶段引以为豪的高端模型,在向没有技术背景的管理层做展…