文章 | 数盟 | Page 367
QQ截图20150326225326 0

Hadoop YARN新特性—label based scheduling

- 基础架构 - 阅 3,209

在最新的hadoop 2.6.0版本中,YARN引入了一种新的调度策略:基于标签的调度机制。该机制的主要引入动机是更好地让YARN运行在异构集群中,进而更好地管理和调度混合类型的应用程序。注意,截止这篇文章发布时,只有apache hadoop 2.6.0和hdp 2.2两个发行版具有该特性(CDH5.3尚不…

201103052209058937 0

对线性回归,logistic回归和一般回归的认识

- 人工智能 - 阅 2,986

作者:JerryLead 1 摘要 本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习中的一种方法。该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类。该方法处理的数据可以…

u=3131699732,3995036256&fm=23&gp=0 0

关于推荐系统中的特征工程

- 人工智能 - 阅 5,221

【数盟活动】Data Science Meetup(2015.04.11)@北京,听京东数据科学家李成华现场解读“深度学习与人工智能” 在多数数据和机器学习的blog里,特征工程 Feature Engineering 都很少被提到。做模型的或者搞Kaggle比赛的人认为这些搞feature工作繁琐又不重要不如多堆几个模型,想入…

figure_Aggr_cutoff 0

Science上发表的经典文章:简单快速的聚类方法

- 文章 - 阅 4,147

【数盟活动】Data Science Meetup(2015.04.11)@北京,听京东数据科学家李成华现场解读“深度学习与人工智能” 译者:范深 前两周因为一个同事的交流,关注了一下canopy辅助Kmeans聚类确定簇数目。然后想起最近很火的一篇Science文章:Clustering by fast search and find of de…

t014c4b75b254a15e5a 0

55分钟学会正则表达式

- 文章 - 阅 2,761

【数盟活动】Data Science Meetup(2015.04.11)@北京,听京东数据科学家李成华现场解读“深度学习与人工智能” 补充:推荐几个正则表达式编辑器 Debuggex :https://www.debuggex.com/ PyRegex:http://www.pyregex.com/ Regexper:http://www.regexper.com/ 正则表达式…

5510f4de93adf 0

干货整理:深度学习 vs 机器学习 vs 模式识别

- 人工智能 - 阅 7,060

【数盟活动】Data Science Meetup(2015.04.11)@北京,听京东数据科学家李成华现场解读“深度学习与人工智能” 作者:Tomasz Malisiewicz 【编者按】本文来自CMU的博士,MIT的博士后,vision.ai的联合创始人Tomasz Malisiewicz的个人博客文章,阅读本文,你可以更好的理解计算机…

t01c03247aa59204e10 0

数据挖掘中最易栽的10个大坑

- 数据分析 - 阅 2,545

按照Elder博士的总结,这10大易犯错误包括: 0. 缺乏数据(Lack Data) 1. 太关注训练(Focus on Training) 2. 只依赖一项技术(Rely on One Technique) 3. 提错了问题(Ask the Wrong Question) 4. 只靠数据来说话(Listen (only) to the Data) 5. 使用了未来的信息…

t01141c33ecd52d3d75 0

如何选择机器学习分类器?

- 人工智能 - 阅 3,783

英文原文:Choosing a Machine Learning Classifier 你知道如何为你的分类问题选择合适的机器学习算法吗?当然,如果你真正关心准确率,那么最佳方法是测试各种不同的算法(同时还要确保对每个算法 测试不同参数),然后通过交叉验证选择最好的一个。但是,如果你只是为你的问…