数据挖掘 | 数盟社区 | Page 2
QQ图片20160830163300 0

不可不知 | 有关文本挖掘的14个概念

- 文章,数据挖掘 - 阅 784

作者:杜尔森·德伦(Dursun Delen)来源:《大数据掘金 挖掘商业世界中的数据价值》,中国人民大学出版社出版我们所处的信息时代以急速增长的数据信息收集、储存和转换成电子格式为特征。大量的商业数据以杂乱无章的文本形式储存。 据美林公司(Merrill Lynch)和高德纳公司(Gar…

798916-20151014220457522-543229966 0

使用SimHash进行海量文本去重

- 数据挖掘 - 阅 1,086

原作者: Poll的笔记 |来自: 博客园 阅读目录 1. SimHash与传统hash函数的区别 2. SimHash算法思想 3. SimHash流程实现 4. SimHash签名距离计算 5. SimHash存储和索引 6. SimHash存储和索引 7. 参考内容 本文介绍的SimHash是一种局部敏感hash,它也是Google公司进行海…

1414625872588 0

用Python挖掘Twitter数据Part1:数据采集

- 数据挖掘 - 阅 2,438

本文为数盟原创译文,转载请注明出处为数盟社区。 这是7部系列中的第1部分,注重挖掘Twitter数据以用于各种案例。这是第一篇文章,专注于数据采集,起到奠定基础的作用。   来自独立数据科学顾问Marco Bonzanini Twitter是一个流行的社交网络,用户可以共享称为…

173850pfbbjnqrdd2qggkd 0

大数据挖掘技术在企业创新中的应用

- 数据挖掘 - 阅 1,173

原作者: 达观数据 陈运文 1、引言 从人类文明诞生的那一刻起,数据就伴随我们而生——人类交流信息所用的文字和语言,计量距离或数量使用的记号和图案,观察自然所积累和传承的经验等,都是数据构成的。这些数据在百万年历史长河里,为人类文明的发展进化带来了难以估量的巨大价…

p23424357 0

用朴素贝叶斯进行文本分类(下)

- 数据分析,数据挖掘 - 阅 1,641

作者: 龙心尘 && 寒小阳 时间:2016年2月。 出处: http://blog.csdn.net/longxinchen_ml/article/details/50629110 http://blog.csdn.net/han_xiaoyang/article/details/50629587 声明:版权所有,转载请联系作者并注明出处 1. 引言 上一篇文章我们主要从理论上…

t0101a7764665e713a0 0

大数据从何而来?你不得不知道的7个数据源供应平台

- 数据挖掘 - 阅 1,944

我们都知道一句话“巧妇难为无米之炊”,数据源就是数据产生价值中的那些大米。那大数据时代企业需要哪些数据呢?根据我个人理解我觉得可以大致分为以下几类: 1、(内部)企业自身业务生产经营环节产生的内部数据(包括销售、客服、仓储、财务等) 2、(运营)可以理解为企业…

QQ截图20160522160939 0

数据挖掘在精准营销中的应用

- 数据挖掘 - 阅 1,505

精准营销就是在精准定位的基础上,依托现代信息技术手段建立个性化的顾客沟通服务体系,实现企业可度量的低成本扩张之路,是有态度的网络营销理念中的核心观点之一。 精准营销需要解决的问题是:哪些用户是某个产品或者营销活动的目标用户?或者是每个用户最适合推荐什么产品…

t0174e624531cb9e5f8_副本 0

决策树算法真的越复杂越好吗?

- 数据挖掘 - 阅 1,705

作者:KPMG大数据挖掘 摘要:对大数据感兴趣的你想必一定知道决策树这个名词吧,是不是也听说过其中各种复杂的组合算法呢?不过,在实际业务中,复杂的算法一定优于简单的算法吗?No......如果你觉得自己认识得还不够深入、全面,或者还缺乏实践的机会,请仔细阅读这篇专业长…