文章 | 数盟 | Page 431
2536-140P6224A1V9 0

当统计学遇上大数据——P值消亡

- 数据分析 - 阅 3,599

有一天,我走进统计学的神殿 ,将所有谎言都装进原假设的盒子里, “P值为零”, 一个声音传来, “但你已经不能再拒绝,因为,P值已经死了” 从此,这个世界上充斥着谎言。 一、一个悲伤的故事:破灭的年少成名之梦 首先跟大家说一个悲伤的故事,该故事来源于…

3f1125d 0

表情符号与神经科学

- 数据分析 - 阅 2,389

很难确切的说第一个表情符号是出现在什么时候。有人认为可以追溯到 1862 年,亚伯拉罕林肯的演讲手稿。但若单纯的就而今的数字化的表情符号而言,这个值得纪念的日子应是 1982 年 9 月 19 日。那时,卡耐基梅隆大学的计算机科学家Scott Fahlman 很随意的用了一串字符 :-) 在论坛…

t01ca209fe3f04637f2 0

Tumblr: Hashing Your Way To Handling 23,000 Blog Requests Per Second

- 文章 - 阅 3,572

This is a guest post by Michael Schenck, SRE Staff Engineer at Tumblr. At Tumblr, blogs (or Tumblelog) are one of our most highly trafficked faces on the internet.  One of the most convenient aspects of tumblelogs is their highly cacheable nature, which is…

QQ图片20140806094903 0

总结Python正文提取的工具包(转)

- 编程语言 - 阅 8,743

本文短链接 http://memect.co/B1DWuNo 一年来我们试用了很多正文提取的工具,准备在这个系列里做一个总结。相关的资源一共有15条,列在这里 http://memect.co/python-text-extraction 会在今后十几条微博里介绍我们的经验教训。 首先推荐看Tomaž Kovačič’2011年很棒的总结。他…

13K591O150450-13F6 0

日志分析方法概述(转载)

- 数据分析 - 阅 4,198

日志在计算机系统中是一个非常广泛的概念,任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同,很难一概而论。 本文讨论的日志处理方法中的日志,仅指Web日志。其实并没有精确的定义,可能包括但不限于各种前端Web服务器——apache…

201101192226404739 0

【转载】机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用

- 人工智能 - 阅 2,659

版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异…

201101081455475507 0

【转载】机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA)

- 人工智能 - 阅 2,799

版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com 前言: 第二篇的文章中谈到,和部门老大一宁出去outing的时候,他给了我相当多的机器学习的建议,里面涉…

201101022146359950 0

【转载】机器学习中的数学(3)-模型组合(Model Combining)之Boosting与Gradient Boosting

- 人工智能 - 阅 2,725

版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com   前言: 本来上一章的结尾提到,准备写写线性分类的问题,文章都已经写得差不多了,但是突然听…