数据分析 | 数盟社区 | Page 41
t0141739a98b79d25da 0

舆情分析的几个主要概念

- 数据分析 - 阅 3,439

作者:平行宇宙 下面是舆情分析领域的几个基础术语的定义,也可认为是研究方向,也为文本挖掘的任务和文献查找提供了思路。 舆情:通常是指较多群众关于现实社会及社会中各种现象、问题所表达的信念、态度、意见和情绪表现的总和;简而言之就是社会舆论和民情。一个严格定义…

QQ截图20150126203920 0

《面向程序员的数据挖掘指南》——(八)聚类

- 数据分析 - 阅 7,429

译者:jizhang 《面向程序员的数据挖掘指南》——(一)简介:数据挖掘是什么 《面向程序员的数据挖掘指南》——(二)推荐系统入门 《面向程序员的数据挖掘指南》——(三)隐式评价和基于物品的过滤算法 《面向程序员的数据挖掘指南》——(四)分类 《面向程序员的数据挖…

20140615.3 0

详解数据挖掘十大经典算法

- 数据分析 - 阅 4,204

作者:莫等闲 国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的1…

t01ffcf6ccd911d5a74 0

基于大规模语料的新词发现算法

- 数据分析 - 阅 2,987

作者:顾森 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢? 这就是所谓的分…

t01cfd13291abc18381_副本 0

用MeCab打造一套实用的中文分词系统

- 数据分析 - 阅 2,232

作者:@52nlp MeCab是一套日文分词(形态分析)和词性标注系统(Yet Another Part-of-Speech and Morphological Analyzer), rick曾经在这里分享过MeCab的官方文档中文翻译: 日文分词器 Mecab 文档,这款日文分词器基于条件随机场打造,有着诸多优点,譬如代码基于C++实现,…

t01254d2b8872258de4_副本 0

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

- 数据分析,人工智能 - 阅 12,191

作者:@52nlp 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python…

t01241656629ff441e1_副本 1

一个被知乎管理员和谐了的“知乎数据抓取程序”(.net、c#数据挖掘)

- 数据分析 - 阅 7,879

作者:wuyidexinsheng 问:能利用爬虫技术做到哪些很酷很有趣很有用的事情? 准备学习python爬虫。各位大神都会用爬虫做哪些有趣的事情?今天突然想玩玩爬虫,就提了这个问题。跟着YouTube上的一个tutor写了个简单的程序,爬了一点豆瓣的数据。主要用到request和bs4(Bea…

chapter-7-33 0

《面向程序员的数据挖掘指南》——(七)朴素贝叶斯和文本数据

- 数据分析 - 阅 4,899

译者:jizhang 《面向程序员的数据挖掘指南》——(一)简介:数据挖掘是什么 《面向程序员的数据挖掘指南》——(二)推荐系统入门 《面向程序员的数据挖掘指南》——(三)隐式评价和基于物品的过滤算法 《面向程序员的数据挖掘指南》——(四)分类 《面向程序员的数据挖…