文章 | 数盟 | Page 3
145202791495850396 0

维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书

- 文章,数据分析,数据挖掘 - 阅 238

没人否认,维基百科是现代最令人惊叹的人类发明之一。 几年前谁能想到,匿名贡献者们的义务工作竟创造出前所未有的巨大在线知识库?维基百科不仅是你写大学论文时最好的信息渠道,也是一个极其丰富的数据源。 从自然语言处理到监督式机器学习,维基百科助力了无数的数据科学项目…

145202791495850396 0

大数据时代人工智能在计算机网络中的运用研究

- 文章,数据分析,人工智能,数据挖掘 - 阅 148

摘要:本文首先探究大数据和人工智能技术,进而提出在计算机网络中如何运用人工智能进行工作。 关键词:人工智能;计算机网络;大数据应用 在大数据时代下,人工智能作为国际上未来几年、几十年发展的重要方向,具有十分广阔的应用空间,适用于各行各业,并且当今生产和生活中也…

0

Spark灰度发布在十万级节点上的实践

- 文章,基础架构,编程语言 - 阅 127

本文介绍了顶级互联网公司数万节点下 Spark 的 CI 与 CD & CD 灰度发布实践。包含如何维护源代码,如何维护 Release 多版本,开发版与正式版,以及如何实现灰度发布,如何进行 hotfix 等。为了提高本文内容的可借鉴性,隐去了公司特有内容,只保留通用部分。 CI 介绍 持续…

123542 0

为何我国大数据市场规模不敌小龙虾?

- 文章,数据分析,数据挖掘 - 阅 190

今年以来,根据中国信息通信研究院《中国大数据发展调查报告2018》数据显示,2017年我国大数据市场规模为236亿元(该统计口径是大数据核心产业,包括大数据软件、硬件和服务的直接产值,不包括附加值)。而同年,我国小龙虾产业连年快速增长,市场规模超千亿元。为何,作为信息时代…

微信推文封面 0

2018数据与媒介发展论坛 报名开启!(内有详细议程)

- 文章,数据分析,数据挖掘 - 阅 176

数据理念和数据技术的发展,为媒体带来前所未有的机遇和挑战。技术推动媒体转型的同时,亦愈加裹挟着媒体的生存空间。算法成为假新闻的助推者还是会成为新闻核查的利器?数据新闻能否为新闻业带来一线生机?这些都已成为亟待探讨的话题。 本届论坛将是对数据与媒介两者关系…

af75497768654fdfabeec1b3b5a08ca7 0

Uber开源Marmaray:基于Hadoop的通用数据摄取和分散框架

- 文章,数据分析,基础架构,数据挖掘 - 阅 215

三年前,Uber采用Apache Hadoop作为数据平台,从而可以跨计算机集群管理数PB的数据。但是,因为我们有很多团队、工具和数据源,所以需要一种可靠的方式来摄取和分散数据。Marmaray是Uber开源的Apache Hadoop数据提取和分散框架。Marmaray由我们的Hadoop平台团队设计和开发,是一…

wKioL1muRTCzKLW1AAB7VVHVCyE315.jpg-wh_651x-s_4174251280 0

开放政府数据价值:内涵、评价与实践

- 文章,数据分析,数据挖掘 - 阅 181

分析开放政府数据的价值与评价,有助于政府数据开放更高效地开展。文章在界定开放政府数据价值内涵与层次划分的基础上,介绍国外开放政府数据价值评价进展,论述开放政府数据价值评价的意义,分析成本/效益理论、利益相关者理论、新公共服务理论作为开放政府数据价值评价支撑理论…

af75497768654fdfabeec1b3b5a08ca7 0

米少熬好粥—数据有限时怎样调优深度学习模型

- 文章,深度学习 - 阅 218

迁移学习 所谓迁移学习,就是将一个问题上训练好的模型通过简单的调整,使其适用一个新的问题,可以认为是一种模型调优的“取巧”方法。可以类比人的举一反三能力。 迁移学习的特点 1、需求数据量少 假设有两个领域,一个领域已经有很多的数据,能成功地建一个模型…