数盟 | Page 2
145202791495850396 0

Spark 踩坑记—Spark Streaming+Kafka

- 202 次阅读 - 文章,基础架构,编程语言

作者:肖力涛 前言 在 WeTest 舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端,我们利用了 spark streaming 从 kafka 中不断拉取数据进行词频统计。本文首先对 spark streaming 嵌入 …

ce5fd91f344ec130f6f42ec265c51839.jpeg-wh_651x-s_2415570986 0

基于知识图谱的警用安保机器人大数据分析技术研究

- 249 次阅读 - 文章,数据分析,人工智能,数据挖掘

摘 要:构建大数据支撑下的智能应用是公安信息化发展的趋势,警用安保机器人大数据分析平台的核心功能包括机器人智能人机交互和前后端融合的大数据情报分析研判。阐述了知识图谱技术在警用安保机器人人机交互和情报分析领域应用的突出优势,并从知识构建、推理挖掘、决策服务等方…

123542 0

没有数学和编程基础,这几个数据科学项目了解一下

- 268 次阅读 - 文章,数据分析,人工智能,数据挖掘

今天,给大家介绍几个比较有特色的数据科学模块,这些模块原本是一些教师用来进行教学使用,帮助学生有机会使用与其课程相关的数据集,并指导学生进行数据分析以及帮助理解统计和计算机原理。 一起来看~ 模块合集链接:https://ds-modules.github.io/DS-Modules/ Introducti…

145202791495850396 0

1460万个目标检测边界框:谷歌开源Open Images V4数据集

- 229 次阅读 - 文章,人工智能,深度学习

Open Images 是谷歌开源的一个大型数据集,包含大约 900 万张图像,这些图像用图像级别的标签和目标边界框进行了标注。最近,谷歌发布了该数据集的第四个版本——Open Images V4,图像数量增加到 920 万,其训练集包含 1460 万个边界框,用于标识从属于 600 个目标类别的…

0537aea4c28648b47529584ffc28e104 0

Nature:刚入校门的PhD们还可以抢救一下

- 192 次阅读 - 文章,人工智能

1. 找到适合自己的节奏,保持健康的工作-生活平衡。读博期间始终维持这种平衡、保持平稳的工作状态可比过度工作然后崩溃好多了。好的身体是成功的关键。 2. 与导师讨论期望。每个人的工作方式不同。确保你了解自己的需求,并及时与导师沟通,这样你可以和导师一起更富有成效地…

123542 0

浅谈深度学习的技术原理及其在计算机视觉的应用

- 283 次阅读 - 文章,人工智能,深度学习

目前,深度学习几乎成了计算机视觉领域的标配,也是当下人工智能领域最热门的研究方向。计算机视觉的应用场景和深度学习背后的技术原理是什么呢?下面让我们来一探究竟。 计算机视觉的应用 什么是计算机视觉呢?形象地说,计算机视觉就是给计算机装上眼睛(照相机)和大脑(算法),…

2868e181e739f35f365ffe212601e759.jpg-wh_651x-s_2749464358 0

爬数据展示国内Go的市场行情到底如何?平均年薪46万?

- 364 次阅读 - 文章,数据分析,数据挖掘

随着云原生时代的到来,拥有高并发性、语法易学等特点的 Golang 地位逐渐凸显,在云原生编程中占据了主导地位。在近期出炉的 TIOBE 10 月编程语言排行榜中,Golang 从前一个月的 16 位一跃来到了 12 位,并且被认为是即将冲进 Top 10 的有力候选;另一方面,Stack Overflow 2018 …

0c3edd91ecd6d77e19dc07f11e441a04 0

各种课程涌现以提高数据科学家技能

- 286 次阅读 - 文章,数据分析,数据挖掘

现在有很多新课程可提高数据科学家的技能和认证。其中一些是现有大学课程的扩展,旨在提高数据科学家的基本技能。同时,还有很多新的数据科学课程提供机会来提高数据科学技能或者扩展到其他领域。 数据科学认证可提高数据科学家的赚钱能力,创建不同数据科学应用程序的实际经验…