数据分析 | 数盟社区 | Page 34
u=1157639397,3603651297&fm=23&gp=0 0

一个简单的基于内容的推荐算法

- 数据分析 - 阅 3,903

作者:EXLsunshine 最近闲下来又开始继续折腾推荐系统了,声明一下,本文只是介绍一下最基础的基于内容的推荐系统(Content-based recommender system)的工作原理,其实基于内容的推荐系统也分三六九等Orz,这里只是简单的较少一下最原始的、最基本的工作流程。 基于内容…

t012bb1830b69b7e619 0

微博背后的那些算法:用户相似度计算、话题因素和领域因素、社区发现…

- 数据分析 - 阅 5,139

作者:张雨石 引言 微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作:原创、转发、回复、阅读、关注、@等。其中,前四个是针对短博文,最后的关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人…

t018eaf9b842fad1141 0

R语言 与 Excel 之数据分析功能比较

- 数据分析 - 阅 4,430

作者:Chris Leonard 我从事数据分析工作已经有十年之久。最初是出于工作需要,我的经理给我一堆数据,我需要处理这些数据。当时我一直使用的工具是 Excel,因为这是我熟练掌握的一款工具。三年前,我开始接触到 R,一开始因为功能太多而坚决抵制使用。后来我开始琢磨如何使用…

9056e013e8c04373b90e2d7a540e205d_副本 0

斯坦福大学怎样讲“情感分析”

- 数据分析 - 阅 3,805

一、自然语言处理概览——什么是自然语言处理(NLP) 1)相关技术与应用 自动问答(Question Answering,QA):它是一套可以理解复杂问题,并以充分的准确度、可信度和速度给出答案的计算系统,以IBM‘s Waston为代表; 信息抽取(Information Extraction,IE):其目的是将非结…

t01452b155117465ddb 0

数据可挖掘的知识类型:概念/类描述、关联模式、聚类分析…

- 数据分析 - 阅 5,485

一、概念/类 描述 概念/类描述就是通过对某类对象关联数据的汇总,分析和比较,用汇总的简洁的精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为:特征性描述和区别性描述。 特征性描述:是指从与某类对象相关的一组数据中提取出关于这些对…

t01d28553ae4b238311 0

Python、R 语言、SAS、SPSS 优缺点比较

- 数据分析 - 阅 12,873

最近一直想入门数据分析的小伙伴问我,如果要入事数据分析一直来说要学那些语言呢?其实小编跟企业部门部门与侯选人接触下来,给我的感觉是对于这个初级的数据分析师来,一般前二年做差不多都是老大让你做的是处理临时需求为主,如果小明给我做个报表,给市场部那边拉一些流量情…

1234 0

主搜索分层优化

- 数据分析 - 阅 1,574

作者:栋宇 摘要 多年以来,主搜索的集群架构和排序算法相对比较单一,一定程度上制约了搜索业务的发展。本文主要介绍主搜索最新采用的索引分层技术。这种分层技术把主搜索集群架构从二维扩展到了三维。基于这种三维的新架构,主搜索可以根据不同的应用场景,选择不同的检索和…

QQ截图20150102192539_副本 0

大数据分析到底需要多少种工具?

- 数据分析 - 阅 3,005

作者:李航 摘要 JMLR杂志上最近有一篇论文,作者比较了179种不同的分类学习方法(分类学习算法)在121个数据集上的性能,发现Random Forest(随机森林)和SVM(支持向量机)分类准确率最高,在大多数情况下超过其他方法。本文针对“大数据分析到底需要多少种工具?”这一问题展…