谁是王者?百度、阿里和腾讯的大数据发展路线和区别 | 数盟社区

看中国科技企业发展,先看BAT。

三家公司各自占据自己的领域,成为了无数小公司叹为仰止的高山,在大数据的领域里,又尤以BAT最为耀眼。

图片描述

在前不久的一次公开会议上,李彦宏、马云、马化腾又对数据的应用产生了公开分歧,三者分别认为数据的价值在于算法、数据量、场景化,这其实是暗合了三家公司的经营方向与理念。百度掌技术,阿里重规模,腾讯把持着社交与游戏,是妥妥的三种企业文化,三个经营方向。

今天就来讲讲三者的交叉与区别。

百度大数据——到底是半壁江山还是黄埔军校?


百度公司是一家妥妥的工程师文化公司,素来就有“数据为重,不为上”的传统。

图片描述
百度大数据产品

作为BAT三家中数据量最大的公司,百度的大数据其实起步是最晚的,自2014年4月24日起,百度正式宣布对外开放“大数据引擎”,包括开放云、数据工厂、百度大脑三大组件在内的核心大数据能力开放,通过大数据引擎向外界提供大数据存储、分析及挖掘的技术能力,将面向多个传统领域逐步开放。同年8月18日,联合国与百度宣布启动战略合作,共建大数据联合实验室(bdl)。据悉,联合国开发计划署与百度大数据联合实验室的目标是探索利用大数据解决全球性问题的创新模式。

百度在开发和运营一整套自主研发的大数据引擎系统,包括数据中心服务器设计、数据中心规划和设计、大规模机器学习、分布式存储、超大规模集群自动化运维、数据管理、数据安全、机器学习(特别是深度学习)、大规模GPU并行化平台等方面,百度“大数据引擎”具有先进性和安全性。

现在的百度从大数据出发,在2012年余凯先生(已离职)的提议下,成立了深度学习实验室(IDL),后历经数位大牛操刀,已经成为了国内AI技术的标杆实验室,并成为了李彦宏未来蓝图中百度的重要押宝方向。

目前驱动中国人工智能向前发展的领导者中,只有寥寥数人出身于高校和研究机构,绝大部分都来自中国顶尖的科技公司,其中中国互联网三巨头BAT(百度、阿里、腾讯)几乎包揽了剩下的名额。而在这些人里,百度占据了近一半的名额,说百度撑起了中国人工智能领军人物的半壁江山并不为过。

可以说若论AI人才储备,百度就是中国AI中的霸王,对于中国AI而言的百度,最近网上有人戏称之为“中国AI黄埔军校”。

这个说法自然有些戏谑,但毫不夸张。

《福布斯》也在今年初发布的另一份报告中指出,百度将自我学习、神经元网络技术融入了核心的搜索业务之中,实现经营方式的创新,也许会成为新的增长点。

百度基于自己的搜索引擎,其数据具有广而不精的特点,与现有技术相结合,目前被百度拿来盈利,最多的是“凤巢”系统的精准营销。

阿里巴巴大数据——电商是其魂,云为其灵


照常理说,BAT中,论大数据,唯独是谈不到阿里的,因为阿里起初的技术基因是最弱的,也不是数据量最大的。但现在若论云计算,偏偏阿里又是最强的。马云先生和王坚博士的高瞻远睹,甚至逐渐让人嗅出了一丝论老练能强于贝佐斯的味道。(日前,Amazon已经成为了世界第一大云服务商,阿里位列第四)。

图片描述
阿里大数据产品

早在2014年时,马云就提出了DT(Data technology)时代的概念,只不过当时和更早的20年前一样,人们不过觉得这个小个子在吹牛罢了。

但这位小个子首富的眼光不可谓不独到,让阿里的大数据成了BAT中起步最早的。

阿里大数据有两个起源,一是始于电商,二是始于阿里云。

不光是大数据始于电商,阿里整个公司都始于电商,电商是阿里大数据之魂。

起初阿里的数据产品名为“量子恒道”(现已更名生意参谋,专为淘宝卖家分析数据使用),可以说阿里对于大数据的认知起点就是始于这个电商数据分析软件的。从2008年起,阿里就把大数据作为一项基本战略,这样的意识完全是阿里在电商领域里尝到过甜头。所谓的数据魔方也好,淘宝指数也好,都是始于“量子恒道”的。

另一个起源是阿里云,阿里云是阿里大数据之灵。

阿里云创立于2009年,截至2016年第三季度,阿里云客户超过230万,付费用户达76.5万 。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。

2016年1月20日,阿里云在2016云栖大会上海峰会上宣布开放阿里巴巴十年的大数据能力,发布全球首个一站式大数据平台“数加”,首批亮相20款产品,这一平台承载了阿里云“普惠大数据”的理想,即让全球任何一个企业、个人都能用上大数据。阿里的大数据团队——数加,就这样诞生了。

魂与灵的结合就是数加的产品商业化十分成熟,且极其符合中国商人的口味,在数据可视化上,其推出的大屏功能最受欢迎(灵感来自双11)。毕竟中国企业服务的两大要点到在这里了,视觉冲击足够大,足够满足管理欲。所以数加产品除了够商业,同时也够“中国”。

在这样的背景下,数加团队越发的朝着可实时性、可解释性、数据准确/稳定性发展,进而由电商为始逐步涉及到制造、金融、政务、交通、医疗、电信、能源等众多领域。

在输出自身大数据能力的同时,“数加”还向有数据开发能力的团队开放。这些团队可入驻“数加”,借助数加上的工具为各行业提供数据服务。“数加”平台首批集中发布了20款产品,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。

就像在淘宝开店一样,只是他们售卖的是专业能力。

腾讯——大数据是腾讯游戏的秘密武器


马化腾这个人特别低调,低调到整个腾讯都学了他“闷声发大财”的路子,很少有相关消息或者报告面世。

图片描述
腾讯大数据产品

但实际上在2009年1月,腾讯就搭建了第一个Hadoop集群,到2010年6月的时候,TDW v0.1版就发布了

腾讯坐拥社交数据、游戏数据、交通数据、舆论数据等等,是场景化非常高的数据。

其中的社交数据,是腾讯自身最擅长的东西。如果腾讯愿意,它甚至可以通过分析得知,你的社会关系、性格禀赋、兴趣爱好、隐私绯闻甚至生理周期和心理缺陷。

腾讯的大多数消费数据都来源于游戏与增值服务。腾讯游戏的收入十分暴利,游戏迷们总是愿意付出高昂的费用来购买虚拟道具,以此满足自己的虚荣心。(据报道,王者荣耀第一季度流水达100亿人民币)

腾讯大数据的应用目前主要是为了完善自家产品,它了解用户的性格禀赋、兴趣爱好、隐私绯闻甚至生理周期,通过这些数据分析得出结果预测,做出来的产品能不受欢迎吗?事实上腾讯游戏的开发,以及一些产品的改进,也正是基于这些数据进行,其应用方法类似《纸牌屋》。

这使得腾讯游戏的发展产生了“马太效应”,坐拥海量游戏数据,做针对性的开发,然后继续完善数据,再开发新游戏。

当然,现在腾讯大数据也早就对外开放了,在2016年还拿了Sort Benchmark排序赛冠军,破了四项世界纪录,98秒内实现了对100TB数据的排序,技术实力也是不容忽视的。

三强的交叉点


大数据并不是报表平台、也不是计算平台,更不等同于精准营销。关键还是要看应用。

在大数据闭环系统中,万事万物都是数据产生者,同时也是数据的使用者。这就需要有大量能互相连接的的数据,在一个大数据计算平台,有相同的数据标准并能产生关联性,通过大数据相关处理技术最终形成自动化、智能化的闭环系统,自动学习,智能调整,从而提升整体的生产效率。

三强的数据量,目前是百度最大,腾讯次之,阿里最小,但阿里的数据变现做的最好。

三强目前的较量除了关起门来研究技术提升自身实力,也在其他领域里频频出手进行数据争夺,百度地图、高德地图、腾讯地图莫不是如此,前段时间的菜鸟物流与顺丰事件,也是阿里和腾讯对物流数据争夺的一个缩影。

三强面对的未来也许是三岔路


说出来你可能不信,国内最早研究大数据的,是在06年左右的暴风影音。但暴风影音只是搭建了一个大数据的架构,并没有对数据本身进行落地应用。

国内除BAT以外的,能说的上在搞大数据的,大概也就是三大电信运营商和银联这些央企了,这些公司和前一类公司的不同点在于他们已经有海量的数据,并且有足够的技术能力和财力。但此类公司目前的研究重点是国家战略的方向,在商用方便考虑较少,加上国企的一些常见病,对大数据的核心分析能力掌握不深,或者是没学习动力,基本是在等别人搞完了再拿过来。

所以说归根结底大数据还是得看怎么应用。

这才有了三强争霸的局面,日后的三强也是一样。

阿里的数据量虽然最小,但有高度商业应用价值,而且多数是结构化的数据。百度和腾讯的数据量都比阿里多很多(准确说,高出了数量级)。腾讯是以社交和游戏为主,而且基本给内部用。百度则是量最大的,主要是为提高用户的搜索体验和广告主的精准营销。

说到底,三家的差别主要是数据来源和商业用途上的差别,核心能力差不多,都基本可以靠Hadoop搞定半结构化数据。

三强面对的不光是彼此,还有国门外的世界,也许100年后的历史书上既不会提奥巴马医改,也不会写川普有性丑闻,但一定会浓墨重彩地写上从2014年起中国领导人决定走可持续发展的道路。

如今的三强正走在赶超GooGle、Amazon等硅谷企业的路上,他们彼此间的竞争其实也是面对新对手前的热身,在吃招喂招之间成长,而不是着眼于彼此。看看最近新闻上的三强在做什么就知道了。

图片描述

阿里忙着去美国底特律开会,买加拿大龙虾帝王蟹,签支付宝国际合作协议;腾讯在忙着收购游戏公司,部署云计算基地;百度在家里憋大招苦修人工智能,无人驾驶。

可以说现阶段的三强间的摩擦都是一些小摩擦,各自其实都有着明确的路线蓝图,现阶段的摩擦不过是为了拿更多的数据喂食自家产品以及在新领域里做做探索罢了。

他们真正的的征程是走出国门迎战Google, Amazon,Microsoft,并且取而代之成为新时代的科技巨头。他们之间的格局最后也会变成Google, Amazon,Microsoft之间这样,既竞争,也彼此包容,既保持警惕,又不能自制的互相欣赏。

现阶段三强和海外巨头的大数据领域主要差距还是在对数据分析的基础研究上和大数据分析人才储备上(国内在大数据人才数量和质量上都和美国差的并不是太大,但毕竟起步晚了)。但大家的发展方向和架构没有本质上的差别。

十年前,拿三强和Google比,会有人讪笑,今天再拿三强和Google比,每一个国人都可以像新闻外交部发言人一样一本正经的说“那是历史的必然选择”

文章来源:36大数据  作者:麒麟

注:转载文章均来自于公开网络,仅供学习使用,不会用于任何商业用途,如果侵犯到原作者的权益,请您与我们联系删除或者授权事宜,联系邮箱:contact@dataunion.org。转载数盟网站文章请注明原文章作者,否则产生的任何版权纠纷与数盟无关。
期待你一针见血的评论,Come on!

不用想啦,马上 "登录"  发表自已的想法.