文章 | 数盟社区 | Page 345
9b9b47 0

Python正则表达式指南

- 编程语言 - 阅 2,000

本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。 注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或…

alysis 0

闲谈数据分析师的素养(转)

- 数据分析 - 阅 2,055

学了四年统计学,毕业后先后做过助理研究员、研究员、数据分析专员、数据分析师,很庆幸,如今自己终于正式走上了数据分析的正轨,今天突发其感,想聊聊数据分析师的一些素养,也许我没有资格去评论什么叫做素养,更没有那个本事,给这样一个神圣的职位去定义什么素养,我写这篇…

0K4 0

如何成为一位数据可视化高手?

- 可视化 - 阅 2,020

数据可视化是一种将数据转换为便于理解和使用的图表的艺术和技术。随着大数据技术的广泛使用,精通数据可视化艺术的人才将在职场上占据有利的位置。     亲爱的安妮:这个月底我就要毕业了,我的专业是市场营销,即将在一家大型消费品公司担任营销和品牌管理的实习生。这件事很…

1779 0

IBM 100年来的变与不变——信息图

- 可视化 - 阅 1,967

现在提起 IBM,你会想到什么? 很可能是 ThinkPad 电脑或者打败象棋世界冠军的深蓝计算机。 自从 2005 年剥离个人电脑业务后,我们越来越少在生活里看到 IBM 的痕迹。取而代之的则是偶尔在杂志上瞥到的广告语,诸如“智慧地球”、“智慧的计算始于云端”之类让人有些疑惑的标语。 …

2536-140P6224A1V9 0

当统计学遇上大数据——P值消亡

- 数据分析 - 阅 2,685

有一天,我走进统计学的神殿 ,将所有谎言都装进原假设的盒子里, “P值为零”, 一个声音传来, “但你已经不能再拒绝,因为,P值已经死了” 从此,这个世界上充斥着谎言。 一、一个悲伤的故事:破灭的年少成名之梦 首先跟大家说一个悲伤的故事,该故事来源于…

3f1125d 0

表情符号与神经科学

- 数据分析 - 阅 2,019

很难确切的说第一个表情符号是出现在什么时候。有人认为可以追溯到 1862 年,亚伯拉罕林肯的演讲手稿。但若单纯的就而今的数字化的表情符号而言,这个值得纪念的日子应是 1982 年 9 月 19 日。那时,卡耐基梅隆大学的计算机科学家Scott Fahlman 很随意的用了一串字符 :-) 在论坛…

t01ca209fe3f04637f2 0

Tumblr: Hashing Your Way To Handling 23,000 Blog Requests Per Second

- 文章 - 阅 3,172

This is a guest post by Michael Schenck, SRE Staff Engineer at Tumblr. At Tumblr, blogs (or Tumblelog) are one of our most highly trafficked faces on the internet.  One of the most convenient aspects of tumblelogs is their highly cacheable nature, which is…

QQ图片20140806094903 0

总结Python正文提取的工具包(转)

- 编程语言 - 阅 7,239

本文短链接 http://memect.co/B1DWuNo 一年来我们试用了很多正文提取的工具,准备在这个系列里做一个总结。相关的资源一共有15条,列在这里 http://memect.co/python-text-extraction 会在今后十几条微博里介绍我们的经验教训。 首先推荐看Tomaž Kovačič’2011年很棒的总结。他…