数盟社区 | Page 423
145_121228160601_1_副本 1

SVM算法分享,及Python实现

- 8,137 次阅读 - 编程语言,人工智能

作者Greg Lamp SVM是什么? SVM是一种训练机器学习的算法,可以用于解决分类和回归问题,同时还使用了一种称之为kernel trick的技术进行数据的转换,然后再根据这些转换信息,在可能的输出之中找到一个最优的边界。简单来说,就是做一些非常复杂的数据转换工作,然后根据预…

53ad1051ca0a8_副本 0

机器学习算法汇总:人工神经网络、深度学习及其它

- 3,156 次阅读 - 人工智能

作者:王萌 学习方式 根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入…

QQ截图20141222170945_副本_副本 0

近日获得A轮融资的NoSQL数据库SequoiaDB正式开源

- 1,794 次阅读 - 基础架构

12月19日,文档型NoSQL数据库SequoiaDB( 官网)宣布正式开源。 SequoiaDB是一款分布式数据库,存储JSON文档类数据格式,解决了传统数据库在数据模型僵硬、可扩展性差、处理海量数据时存在的性能瓶颈、以及缺乏处理半结构和非结构化数据的能力等各种局限性;同时SequoiaDB…

t0196e1c428a2e932a3_副本 0

使用Apache Hadoop、Impala和MySQL进行数据分析

- 2,738 次阅读 - 数据分析,基础架构

作者 孙镜涛 Apache Hadoop是目前被大家广泛使用的数据分析平台,它可靠、高效、可伸缩。Percona公司的Alexander Rubin 最近发表了一篇博客文章介绍了他是如何将一个表从MySQL导出到Hadoop然后将数据加载到Cloudera Impala并在这上面运行报告的。 在Alexander Rubin的这个…

445 0

大数据企业应用玩法攻略③数据关联、数据废气和黑暗数据

- 1,906 次阅读 - 未分类

作者:吕本富 大数据主要不作因果判断,主要适用于关联分析。很多关联分析并不需要复杂的模型,只需要具有大数据的意识。比如,通过对发薪日、体育项目、降雨天气和假日等变量和犯罪率进行关联分析,从而优化警力配置,有效地防止犯罪。宾夕法尼亚州政府分析全州感冒药品…

20141222134630106_副本 0

Spark 1.2 发布,开源集群计算系统,新特性概述如下

- 2,473 次阅读 - 基础架构

作者:陈超 Spark 1.2 发布,此版本包括 172 位贡献者和超过 1000 个 commits。 此版本包括 Spark 核心操作和性能改进; 添加新的网络传输子系统,进行了较大的改进; Spark SQL 引入了一个外部数据源的支持,支持 Hive13; 动态分区; fixed-precision decima…

QQ截图20141222151136_副本 0

大数据,被媒体和一帮理工文盲玩坏了

- 1,778 次阅读 - 未分类

作者:番茄土豆 Lillian Song 现在大数据被媒体一帮理工文盲玩坏了。。。觉得数据量大就是大数据,或者甚至里面数字大也是大数据。。。。唉 请问统计个搜索量跟大数据有什么关系...... 所谓Big Data其实是有两部分组成的。一部分是海量运算存储能力,一部分是数据建模算…

image 0

北京地铁一日客流数据可视化

- 3,688 次阅读 - 未分类,可视化

@王静远BUAA #BIGSCity# #乘客去哪儿# 今天的“大数据时代的城市空间发展研讨会”上给大家展示了 "One Day in Beijing Metro"的视频。视频的在线链接在|北京地铁一日客流数据可视化 One Day in Beijing Metro ,BIGSCity上的网页在http://t.cn/R7NPcH8 ,欢迎观赏,欢迎转载,欢迎…