数据分析 | 数盟 | Page 70
t01452b155117465ddb 0

数据可挖掘的知识类型:概念/类描述、关联模式、聚类分析…

- 数据分析 - 阅 7,826

一、概念/类 描述 概念/类描述就是通过对某类对象关联数据的汇总,分析和比较,用汇总的简洁的精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为:特征性描述和区别性描述。 特征性描述:是指从与某类对象相关的一组数据中提取出关于这些对…

t01d28553ae4b238311 0

Python、R 语言、SAS、SPSS 优缺点比较

- 数据分析 - 阅 18,664

最近一直想入门数据分析的小伙伴问我,如果要入事数据分析一直来说要学那些语言呢?其实小编跟企业部门部门与侯选人接触下来,给我的感觉是对于这个初级的数据分析师来,一般前二年做差不多都是老大让你做的是处理临时需求为主,如果小明给我做个报表,给市场部那边拉一些流量情…

1234 0

主搜索分层优化

- 数据分析 - 阅 1,928

作者:栋宇 摘要 多年以来,主搜索的集群架构和排序算法相对比较单一,一定程度上制约了搜索业务的发展。本文主要介绍主搜索最新采用的索引分层技术。这种分层技术把主搜索集群架构从二维扩展到了三维。基于这种三维的新架构,主搜索可以根据不同的应用场景,选择不同的检索和…

QQ截图20150102192539_副本 0

大数据分析到底需要多少种工具?

- 数据分析 - 阅 3,511

作者:李航 摘要 JMLR杂志上最近有一篇论文,作者比较了179种不同的分类学习方法(分类学习算法)在121个数据集上的性能,发现Random Forest(随机森林)和SVM(支持向量机)分类准确率最高,在大多数情况下超过其他方法。本文针对“大数据分析到底需要多少种工具?”这一问题展…

t010e1258036ed0f8b1 0

算法在搜索引擎行业中的应用(PPT)

- 数据分析 - 阅 2,339

数盟上海DSM聚会分享 分享嘉宾:李晓冬(复歌科技技术总监) 内容概要: 搜索引擎市场现状: Baidu 自2007年起主导国内市场 360 自2012年8月上线后,迅速占领市场第二宝座 Sogou 由搜狐研发,后与Soso合并 Google 自推出中国以来,持续失去市场份额 搜索广…

3 1

在线最优化求解(Online Optimization)之一:关于最优化求解的预备知识

- 数据分析 - 阅 7,747

作者:@fengyoung 动机与目的 在实际工作中,无论是工程师、项目经理、产品同学都会经常讨论一类话题:“从线上对比的效果来看,某某特征或因素对xx产品的最终效果有很大的影响”。这类话题本质上说的是通过已有的数据反映出某些特定的因素对结果有很强的正(或负)相关性。而如…

t01cedf659657bf7516 0

如何挖掘弹幕背后的情感信息价值?

- 数据分析 - 阅 2,166

弹幕背后蕴藏的是丰富的情感信息 弹幕从一个军事用语转变成一个网络用语,最初来源于2006年日本的一个动漫niconico网页,到今年的3月底niconico有了4000万的注册用户,有200多万是付费用户,可以说它已经成为日本年轻人的一个重要社区。niconico慢慢渗透到日本全民生活中,连日…

640_副本 1

用户画像数据建模方法

- 数据分析 - 阅 5,910

  从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技…