文章 | 数盟 | Page 364
t01719f4bc8ba12a714 0

程序员必须知道的10大基础实用算法及其讲解

- 文章 - 阅 4,150

算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο( n log n )次比较。在最坏状况下则需要Ο( n 2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο( n log n ) 算法更快,因为它的内部循环(inner loop)可以在大…

t01782a3c9486d81b76 1

NLP大神推荐的机器学习入门书单(附大量百度网盘电子书)

- 人工智能 - 阅 38,840

作者:hankcs 继NLP之后,我又开了ML这个大坑。这是因为NLP涉及到太多的ML模型,仅仅拿过来用的话,我实现的HanLP已经快到个人极限了。而模型背后的原理、如何优化、如何并行化等问题,都需要寻根求源才能解决。 所以我找了个书单自学,电子书为主,顺便分享出来。 …

t01cc4f294b3e7a0568 0

小技巧:Python 爬虫解决登录问题的另类方法

- 文章,编程语言 - 阅 3,255

爬虫爬网站不免遇到需要登录的问题. 登录的时候可能还会碰到需要填验证码的问题, 有的验证码甚至是拖动拼图来完成的. 虽然现在这些都有开源解决方案, 但是假设现在只是自己做个小小的不具规模的爬虫来玩一玩; 或者主要的精力想要放在如何解析 html, 或者验证抓取算法上, 而不是通…

20150318111642328 0

挖出小马哥–利用d3.js对QQ群大数据资料进行可视化分析

- 数据分析,可视化 - 阅 5,347

作者: Anthr@X 背景 对于前段时间流出的QQ群数据大家想必已经有所了解了,处理后大小将近100G,多达15亿条关系数据(QQ号,群内昵称,群号,群内权限,群内性别和年龄)和将近9000万条群信息(群号,群名,创建时间,群介绍),这些数据都是扁平化的2维表格结构,直接查询…

t01636a5d846f859577 0

cxxnet和大规模深度学习

- 人工智能 - 阅 3,209

作者:@陈天奇怪 这篇文章介绍的是关于并行深度神经网络的设计。在今年发布的两个机器学习项目中,cxxnet是最精彩的一个。因为它包含了我们团队可以发挥到的机器学习和系统的各个方面的极致: 除了前沿的深度学习之外,它的两个独到特点也是让我们在设计实现中最为享受的。 1…

t019e4eedfbb9734d79 0

训练深度神经网络的时候需要注意的一些小技巧

- 人工智能 - 阅 3,382

翻译:@kevin好好学习 翻译网上的哈,我觉得有很大一部分从没看到过,所以就翻译了下,如有不对的地方,欢迎指正: 1、准备数据:务必保证有大量、高质量并且带有干净标签的数据,没有如此的数据,学习是不可能的 2、预处理:这个不多说,就是0均值和1方差化 3、mini…

143302418660 0

传12306图片验证12小时内被破解,机器自动识别验证码的原理是怎么样的?

- 文章 - 阅 15,992

作者:林灿斌 机器自动识别验证码的原理是怎么样的? 我自己写验证码识别模块的时候是这样的,当然不一定大家都这样写,肯定有更好的算法,我要识别的那个验证码是比较简单地那种,所以这样写就够了。 我用Windows的画图工具画了这个张图,用来举个例子: 这…

6941baebgw1epzadjhxlsj208c07v0tr 0

支持向量机在 R 语言中的实现和使用

- 人工智能 - 阅 3,420

支持向量机是一个相对较新和较先进的机器学习技术,最初提出是为了解决二类分类问题,现在被广泛用于解决多类非线性分类问题和回归问题。继续阅读本文,你将学习到支持向量机如何工作,以及如何利用R语言实现支持向量机。 支持向量机如何工作? 简单介绍下支持向量机是做什么的…