数据分析 | 数盟 | Page 67
QQ截图20150126203920 0

《面向程序员的数据挖掘指南》——(八)聚类

- 数据分析 - 阅 9,323

译者:jizhang 《面向程序员的数据挖掘指南》——(一)简介:数据挖掘是什么 《面向程序员的数据挖掘指南》——(二)推荐系统入门 《面向程序员的数据挖掘指南》——(三)隐式评价和基于物品的过滤算法 《面向程序员的数据挖掘指南》——(四)分类 《面向程序员的数据挖…

20140615.3 0

详解数据挖掘十大经典算法

- 数据分析 - 阅 4,917

作者:莫等闲 国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的1…

t01ffcf6ccd911d5a74 0

基于大规模语料的新词发现算法

- 数据分析 - 阅 3,807

作者:顾森 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢? 这就是所谓的分…

t01cfd13291abc18381_副本 0

用MeCab打造一套实用的中文分词系统

- 数据分析 - 阅 2,902

作者:@52nlp MeCab是一套日文分词(形态分析)和词性标注系统(Yet Another Part-of-Speech and Morphological Analyzer), rick曾经在这里分享过MeCab的官方文档中文翻译: 日文分词器 Mecab 文档,这款日文分词器基于条件随机场打造,有着诸多优点,譬如代码基于C++实现,…

t01254d2b8872258de4_副本 0

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

- 数据分析,人工智能 - 阅 13,960

作者:@52nlp 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python…

t01241656629ff441e1_副本 1

一个被知乎管理员和谐了的“知乎数据抓取程序”(.net、c#数据挖掘)

- 数据分析 - 阅 9,293

作者:wuyidexinsheng 问:能利用爬虫技术做到哪些很酷很有趣很有用的事情? 准备学习python爬虫。各位大神都会用爬虫做哪些有趣的事情?今天突然想玩玩爬虫,就提了这个问题。跟着YouTube上的一个tutor写了个简单的程序,爬了一点豆瓣的数据。主要用到request和bs4(Bea…

chapter-7-33 0

《面向程序员的数据挖掘指南》——(七)朴素贝叶斯和文本数据

- 数据分析 - 阅 5,535

译者:jizhang 《面向程序员的数据挖掘指南》——(一)简介:数据挖掘是什么 《面向程序员的数据挖掘指南》——(二)推荐系统入门 《面向程序员的数据挖掘指南》——(三)隐式评价和基于物品的过滤算法 《面向程序员的数据挖掘指南》——(四)分类 《面向程序员的数据挖…

chapter-6-2 0

《面向程序员的数据挖掘指南》——(六)朴素贝叶斯和概率

- 数据分析 - 阅 6,905

译者:jizhang 《面向程序员的数据挖掘指南》——(一)简介:数据挖掘是什么 《面向程序员的数据挖掘指南》——(二)推荐系统入门 《面向程序员的数据挖掘指南》——(三)隐式评价和基于物品的过滤算法 《面向程序员的数据挖掘指南》——(四)分类 《面向程序员的数据…