数盟社区 | Page 382
t01b6759abc3ba221ff_副本 0

淘宝总监揭淘宝搜索算法现状!

- 2,924 次阅读 - 未分类

作者介绍:青峰,淘宝搜索算法总监。 淘宝搜索排序的目的是帮助用户快速的找到需要的商品。从技术上来说,就是在用户输入关键词匹配到的商品中,把最符合用户需求的商品排到第一位,其它的依次排在后续相应的位置。为了更好的实现这个目标,算法排序系统基本按三个方面来…

t01719f4bc8ba12a714 0

程序员必须知道的10大基础实用算法及其讲解

- 3,824 次阅读 - 文章

算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο( n log n )次比较。在最坏状况下则需要Ο( n 2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο( n log n ) 算法更快,因为它的内部循环(inner loop)可以在大…

t01782a3c9486d81b76 1

NLP大神推荐的机器学习入门书单(附大量百度网盘电子书)

- 30,980 次阅读 - 人工智能

作者:hankcs 继NLP之后,我又开了ML这个大坑。这是因为NLP涉及到太多的ML模型,仅仅拿过来用的话,我实现的HanLP已经快到个人极限了。而模型背后的原理、如何优化、如何并行化等问题,都需要寻根求源才能解决。 所以我找了个书单自学,电子书为主,顺便分享出来。 …

t01cc4f294b3e7a0568 0

小技巧:Python 爬虫解决登录问题的另类方法

- 2,948 次阅读 - 文章,编程语言

爬虫爬网站不免遇到需要登录的问题. 登录的时候可能还会碰到需要填验证码的问题, 有的验证码甚至是拖动拼图来完成的. 虽然现在这些都有开源解决方案, 但是假设现在只是自己做个小小的不具规模的爬虫来玩一玩; 或者主要的精力想要放在如何解析 html, 或者验证抓取算法上, 而不是通…

20150318111642328 0

挖出小马哥–利用d3.js对QQ群大数据资料进行可视化分析

- 4,478 次阅读 - 数据分析,可视化

作者: Anthr@X 背景 对于前段时间流出的QQ群数据大家想必已经有所了解了,处理后大小将近100G,多达15亿条关系数据(QQ号,群内昵称,群号,群内权限,群内性别和年龄)和将近9000万条群信息(群号,群名,创建时间,群介绍),这些数据都是扁平化的2维表格结构,直接查询…

t013391b130a0c1e7f9 0

阿里巴巴数据产品经理工作(总结篇)

- 2,980 次阅读 - 未分类

PD(指产品经理,下同)本身就是在做牛做马,关系圈异常复杂。数据PD也不例外。而且打交道的人更多。以下是我用PPT绘制的数据产品经理关系圈。 科普: PD:对于WEB产品设计人员而言,它的意思是“产品设计人员”,即produce designer。 PD:在IT企业中,一般是Product Direc…

t01636a5d846f859577 0

cxxnet和大规模深度学习

- 2,747 次阅读 - 人工智能

作者:@陈天奇怪 这篇文章介绍的是关于并行深度神经网络的设计。在今年发布的两个机器学习项目中,cxxnet是最精彩的一个。因为它包含了我们团队可以发挥到的机器学习和系统的各个方面的极致: 除了前沿的深度学习之外,它的两个独到特点也是让我们在设计实现中最为享受的。 1…

t019e4eedfbb9734d79 0

训练深度神经网络的时候需要注意的一些小技巧

- 2,863 次阅读 - 人工智能

翻译:@kevin好好学习 翻译网上的哈,我觉得有很大一部分从没看到过,所以就翻译了下,如有不对的地方,欢迎指正: 1、准备数据:务必保证有大量、高质量并且带有干净标签的数据,没有如此的数据,学习是不可能的 2、预处理:这个不多说,就是0均值和1方差化 3、mini…