数据分析 | 数盟社区 - Part 3
u=1754307772,197848542&fm=11&gp=0 0

数据分析平台搭建案例

- 文章,数据分析 - 阅 424

作者:hualalalalali  来源:CSDN博客 如今,市场的变化越来越快,业务调整也越来越频繁,承载业务流程的信息化也在不断提升,选择一个能灵活应对需求的系统工具成了必需。 选择什么样的工具,如何应用?这里分享某保险公司的案例,从整合系统数据、可视化管理与几个应用案…

wKiom1fGeX7AcpaAAABltFMKg94259.jpg-wh_651x-s_3151432045 0

终极对决:R 与 Excel 在数据分析当中的优劣势对比

- 文章,数据分析 - 阅 330

Excel是一款不错的数据分析工具,但是,如果你只有这一款工具,则会大大影响你的工作效率。相比之下,R 更好用,而且提供的工具集模块更完整。而缺点在于不是非常易于上手,用户一开始相对要花很多时间学习使用。如果坚持下去,就会有所收获,不仅对数据更了解,还提高了自己…

251137307646933 0

帮助企业开始采用大数据的7大工具

- 文章,数据分析,可视化 - 阅 482

来源:网络大数据 几乎每一个行业厂商都希望过渡到一个数据驱动的方法。不过,虽然许多企业擅长收集数据,但了解数据却是比较困难的。以下介绍的这七个工具可以提供帮助。 今天许多企业都在努力解决一个大问题:如何管理我们的数据?在收集资料的同时,如何分析和理解更…

u=3375120849,45058865&fm=21&gp=0 0

Hadoop的过去、现在和未来

- 文章,数据分析 - 阅 344

作者:佚名 来源:比特网 Hadoop是目前大数据分析领域中应用最广泛的一种分布式架构,而经过相当长时间的发展,Hadoop在功能上也越来越成熟。不过,在这个星球上,你找不到拥有11年Hadoop经验的人。因为目前在Hadoop领域经验最丰富的人是Doug Cutting,他在Hadoop方面拥有…

wangxiaojing0a6cf14d8bb64a4abef4aa8af0a565bd 0

使用基于Apache Spark的随机森林方法预测贷款风险

- 数据分析 - 阅 1,908

原文:Predicting Loan Credit Risk using Apache Spark Machine Learning Random Forests 作者:Carol McDonald,MapR解决方案架构师 翻译:KK4SBB 责编:周建丁(zhoujd@csdn.net) 在本文中,我将向大家介绍如何使用Apache Spark的spark.ml库中的随机森林算法来对银行信用…

241 0

一组数据告诉你,打车软件拼优惠到底哪家强

- 数据分析 - 阅 709

作者:PMCAFF  原文链接http://www.tmtpost.com/2413990.html 摘要: “9公里以内,用Uber;9-16公里,用滴滴;16公里以上,用易道,”这一“打车省钱攻略”在微博引发了热议。 问:“打车软件哪家强?” 答:“9公里以内,用Uber;9-16公里,用滴滴;16公里以上,用易道…

160959n2fqwzyzffw2fwyy 0

谷歌BigQuery现在允许查询所有GitHub开源项目了

- 数据分析 - 阅 784

作者 Sergio De Simone ,译者 谢丽 谷歌和GitHub宣布,谷歌BigQuery现在为GitHub上280多万个托管开源项目提供了一个完整的快照。这让用户可以使用SQL查询托管在GitHub上的将近20亿个开源文件。 GitHub的BigQuery数据集以GitHub Archive项目为基础,该项目旨在获取GitHub特…

1590437628-5783072e39078_articlex 0

Python爬虫实战(3):安居客房产经纪人信息采集

- 数据分析,编程语言 - 阅 1,443

作者:fullerhua 原文链接:https://segmentfault.com/a/1190000005929693 1, 引言 Python开源网络爬虫项目启动之初,我们就把网络爬虫分成两类:即时爬虫和收割式网络爬虫。为了使用各种应用场景,该项目的整个网络爬虫产品线包含了四类产品,如下图所示: 本实战是上…