编程语言 | 数盟 | Page 2
a716fd45ly1fha7xpi48tj20s20ffaqj 0

深入分析一款简单的Github信息泄露爬虫

- 文章,编程语言 - 阅 137

作者:grt1stnull 0×01.前言 Github作为一个代码托管平台,有着海量的开源代码和许多开发者。在代码上传时,有些开发者缺乏安全意识,会在不经意间泄露自己的密码或者密钥。本文以这里为切入点,介绍一个检索代码信息的小爬虫以及在写爬虫时的一些奇技淫巧。 0×02…

145718i1sxmdwzmiohs147 0

简单12招让Hive运行快一点,再快一点

- 文章,基础架构,编程语言 - 阅 132

摘要:Hive可以让你在Hadoop上使用SQL,但是在分布系统上的SQL的调优是不同的。这里有12个技巧能够帮助你。 Hive并不是一个关系型数据库,但它假装是大部分情况中的一个。它有表格,运行SQL,并且支持JDBC和ODBC。 这个启 ... Hive可以让你在Hadoop上使用SQL,但是在分布…

146961561298434558 0

倪光南回忆造芯:没做成事之前,都可能被当成“唐吉诃德”

- 文章,编程语言 - 阅 134

(原标题:倪光南回忆造芯:没做成事之前,都可能被当成“唐吉诃德”) 中兴被罚事件唤醒了公众对“中国芯”的关注,曾任中国工程院院士倪光南助手的梁宁发表文章《一段关于国产芯片和操作系统的往事》,回忆了当年和倪光南等人一起研发芯片和操作系统的历史,在朋友圈广泛传播。 …

939b5eb1cde6935a98477fd2125ea544.jpg-wh_651x-s_2292250043 0

5 种使用 Python 代码轻松实现数据可视化的方法

- 文章,编程语言,深度学习 - 阅 355

原文出处: towardsdatascience   译文出处:oschina 数据可视化是数据科学家工作中的重要组成部分。在项目的早期阶段,你通常会进行探索性数据分析(Exploratory Data Analysis,EDA)以获取对数据的一些理解。创建可视化方法确实有助于使事情变得更加清晰易懂,特别是对于大型…

4 0

如何在万亿级别规模的数据量上使用Spark

- 文章,编程语言,人工智能,深度学习 - 阅 375

本文主要是通过作者在搭建使用计算平台的过程中,写出对于Spark的理解,并且介绍了Spark在当前的DataMagic是如何使用的,当前平台已经用于架平离线分析,每天计算分析的数据量已经达到千亿~万亿级别。 一、前言 Spark作为大数据计算引擎,凭借其快速、稳定、简易等特点,快速的…

1-7 0

10大人工智能领域引领媒体行业的自动化

- 文章,编程语言,人工智能,深度学习 - 阅 158

在这个数据爆炸的时代,收集数据本身是不够的。它需要被加工,切片和切割,以获得经营和发展业务的洞察力。不幸的是,当今世界上大多数可用的数据是非结构化的和隐藏的,使得在没有显著的人类参与的情况下难以处理。媒体行业的大部分数据都属于这一类,但已经开始改变。 任何…

240458-1F21P55P387 0

人人都能用的深度学习:当前三大自动化深度学习平台简介

- 文章,编程语言,深度学习 - 阅 228

深度学习技术往往比较复杂,从头开发的难度较大,但现在有一些公司提供了能帮助开发者轻松使用深度学习的自动化深度学习(ADL)平台,比如微软的 CustomVision.AI、谷歌的 Cloud AutoML、OneClick.AI。Data Science Central 近日发文对这三个平台进行了比较和盘点,机器之心对该文…

NLP 0

基于线性网络的语音合成说话人自适应

- 文章,编程语言,人工智能,深度学习 - 阅 192

说话人自适应算法利用说话人少量语料来建立说话人自适应语音合成系统,该系统能够合成令人满意的语音。在本文中,我们提出了基于线性网络的语音合成说话人自适应算法。该算法对每个说话人学习特定的线性网络,从而获得属于目标说话人的声学模型。通过该算法,使用200句目标说话人…