数盟社区 | Page 435
123 0

将数据从PostgreSQL同步到Elasticsearch的经验总结

- 2,475 次阅读 - 文章

作者 李士窑 Elasticsearch是一款基于Apache Lucene构建的开源全文检索引擎,它能够轻松地进行大规模的横向扩展,以支撑PB级的结构化和非结构化海量数据的处理。而关系型数据库比较擅长对数据的管理,但对全文检索功能的支持相对不足,所以有时候一些实际项目需要将关系型数据…

correlation_optimizer 0

盘点SQL on Hadoop中用到的主要技术

- 2,628 次阅读 - 基础架构

作者:肥男爱肉 考虑到系统使用的广泛程度与成熟度,在具体举例时一般会拿Hive和Impala为例,当然在调研的过程中也会涉及到一些其他系统,如Spark SQL,Presto,TAJO等。而对于HAWQ这样的商业产品和apache drill这样成熟度还不是很高的开源方案就不做过多了解了。 系统架构 …

Rnq2Ar 0

Image classification的几个常见CNN model

- 11,377 次阅读 - 人工智能

作者:Rachel-Zhang 昨天食堂, 老板:你在 IDL 那边实习用了什么模型下周讲一下? 我:我一直在做工程。。。 老板:做工程也会看看paper吧,也会用一些模型吧? 我:囧。。。是用了一下deep learning学出来的feature 老板:那就有什么都跟大家分享一下哦~ …

22 0

数据可视化神器:开源组件Echarts使用心得总结(二)

- 4,850 次阅读 - 可视化

前言: 前一段时间一直都挺忙的,各种事,也没来得及每周的总结,趁着晚上的一点时间把项目中用的Echart中常用的各种图表给抽象总结了一下,趁着周末跟大家分享一下。之前写过一篇相关的文章,当时主要是讲了如何引入、使用Echart,最新的Echart版本已经发布,之前讲的很多文件…

22 0

数据可视化神器:开源组件ECharts使用心得(一)

- 6,341 次阅读 - 可视化

前言 上周项目组要临时给客户做一个演示的原型,首页设计的是一个中国地图,本来打算用谷歌的地图,但是,做出来之后,整体的效果看起来太差了,最后就在网上搜相关的地图呈现的控件,然后就找到了这个ECharts报表呈现组件,挺不错的一个组件,而且地图数据都是离线的,真心很赞…

157 0

数据之美,美国2014年度18张最佳信息图

- 3,148 次阅读 - 可视化

我们生活在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来,如果想用“学海无涯苦作舟”的精神梳理清楚这些包含了各个领域(历史、心理、时事、文学)的信息恐怕已经不太现实。不过聪明人总能化繁为简,深入浅出,数据图表天才们用简洁、直观又有…

t01972eb488ab9fd931 0

深度学习的研究领域是否有被过度夸大?

- 2,769 次阅读 - 人工智能

知乎问答 问:深度学习的研究领域是否有被过度夸大? 我是个机器学习领域的门外汉,最近经常在weibo和科技网站看到深度学习的字眼,感觉很神奇也很深奥,但偶尔在一些学术的论坛里也看到了不同的声音,其实我一直在关注这个领域,却是有一种感觉,很多时候那些专家大牛的…

t01d28553ae4b238311 0

Python、R 语言、SAS、SPSS 优缺点比较

- 16,246 次阅读 - 数据分析

最近一直想入门数据分析的小伙伴问我,如果要入事数据分析一直来说要学那些语言呢?其实小编跟企业部门部门与侯选人接触下来,给我的感觉是对于这个初级的数据分析师来,一般前二年做差不多都是老大让你做的是处理临时需求为主,如果小明给我做个报表,给市场部那边拉一些流量情…