文章 | 数盟
1544731620481 0

图解当前最强语言模型BERT:NLP是如何攻克迁移学习的?

- 文章,人工智能 - 阅 63

昨日,《华盛顿邮报》视频编辑、曾获艾美奖提名的 Gillian Brockell 写了一封对 Facebook、推特、Instagram 以及所有社交网络的公开信。 一封令人心痛的公开信 致技术公司: 我知道你们知道我怀孕了。这是我的错,我没有抵抗住 Instagram 话题标签——#30weekspregnant、#baby…

635748032372815780688 0

自动机器学习计算量大!这种多保真度优化技术是走向应用的关键

- 文章,编程语言,深度学习 - 阅 65

自动机器学习一直以来都以计算量大而著称,贝叶斯优化等以高效著称的方法也都没能很好解决此问题,机器学习开发者很多还是依赖于经验与直观理解进行手动调参。近日南京大学、第四范式和香港科技大学提出了一种多保真度自动机器学习方法,其在优化过程中利用修正后低保真度评价来…

0537aea4c28648b47529584ffc28e104 0

PyTorch经验指南:技巧与陷阱

- 文章,人工智能,深度学习 - 阅 337

项目地址:https://github.com/Kaixhin/grokking-pytorch PyTorch 是一种灵活的深度学习框架,它允许通过动态神经网络(例如利用动态控流——如 if 语句或 while 循环的网络)进行自动微分。它还支持 GPU 加速、分布式训练以及各类优化任务,同时还拥有许多更简洁的特性。以…

t011d211b27f68666ba 0

轻松看懂机器学习!3个案例详解聚类、回归、分类算法

- 文章,人工智能,深度学习 - 阅 323

机器学习,一言以蔽之就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预来总结和归纳其特征和特点,并用这些特征和特点和一定的学习目标形成映射关系,进而自动化地做出相应反应的过程。 这个反应可能是做出相应的标记或判断,也可能是输出一段内容——图片…

20181029021552838 0

大数据实践 | Kafka不够好,智联招聘基于Pulsar打造企业级事件中心

- 文章,数据分析,数据挖掘 - 阅 300

消息队列作为智联招聘非常重要的平台级服务负责全业务线的消息投递。有很多非常典型的业务场景,我们用一个业务场景简历投递来说明消息队列为业务提供的支持 图 1. 简历投递业务 当 C 端用户发生一次简历投递的时候会先发送一条消息到消息队列服务,C 端中台、B 端中台以…

201812318718764860 0

手把手教你用Python进行Web抓取(附代码)

- 文章,基础架构,数据挖掘,深度学习 - 阅 317

本教程以在Fast Track上收集百强公司的数据为例,教你抓取网页信息。 作者:Kerry Parker 翻译:田晓宁 本教程以在Fast Track上收集百强公司的数据为例,教你抓取网页信息。 作为一名数据科学家,我在工作中所做的第一件事就是网络数据采集。使用代码从网站收集数据…

t011d211b27f68666ba 0

电商搜索算法技术的演进

- 文章,人工智能,深度学习 - 阅 268

青峰老师带你回顾搜索算法技术的发展之路。 作者简介:青峰,搜索推荐算法技术负责人,阿里巴巴研究员 一 、淘宝搜索的一些特点 淘宝有几十亿商品,挂靠在几千个叶子类目,上百个一级类目,十几个行业下面。如何能让用户找到符合意图的商品,是淘宝搜索需要解决的首要问题…

1534402002098 0

如何理解深度学习的优化?通过分析梯度下降的轨迹

- 文章,人工智能,深度学习 - 阅 273

深度学习很大程度上仍是一个黑箱,但研究者一直没有停下理解它的步伐。普林斯顿高等研究院的研究者 Nadav Cohen 近日发文介绍了理解深度学习优化的进展以及他们近期在这方面的一项研究成果。 神经网络优化本质上是非凸的,但简单的基于梯度的方法似乎总是能解决这样的问题。…