互联网技术 / 互联网资讯 · 2023年12月4日 0

互联网巨头在大数据领域的布局与未来发展趋势分析

在大数据迅猛发展的时代,各大企业纷纷投入这场竞争,争相抢占市场。而作为大数据的实践者,我们如何在这个智慧时代中跟上大数据的发展步伐,抓住其未来方向呢?

前言

大数据的概念最早出现在2000年左右,伴随着互联网的飞速发展。经过几年的演变,Hadoop在2008年成为Apache顶级项目,标志着大数据走向体系化发展的快速阶段,Hadoop也因此成为大数据生态体系的象征。

自2014年起,国内出现了大量大数据企业,形势可用“乱花渐欲迷人眼”来形容。正是在这一年,我国的《政府工作报告》首次提及大数据,正式将其视作新兴产业,并上升为国家战略。从此,大数据频繁出现在各大媒体的报道中。

互联网企业在大数据的布局方面较早且深度融合,这一行业凭借其互联网属性,迅速进入大数据领域。

提到国内的互联网大数据企业,百度、阿里和腾讯三巨头不可忽视。它们的大数据业务围绕自身核心业务展开:百度专注算法,阿里重视电商,腾讯则偏向社交。三者在大数据布局上各有侧重,反映了各自的战略方向与思路。

BAT的大数据产业

在我国,BAT三家公司是较早布局大数据的互联网企业,并且具备明显的竞争优势。其中,阿里最早进入大数据产业,腾讯次之,而百度则相对较晚。

阿里

阿里在2008年提出了其大数据发展战略,随后围绕电商业务进行了数据集群和数据仓库等方面的布局。

如今,阿里大数据的发展可从两个方面来看:一是建立在电商基础上的阿里数据;二是阿里云。

阿里数据通过淘宝、天猫、阿里妈妈等平台,形成了从数据采集到应用的闭环系统,涵盖数据采集、计算、服务和应用等环节。

阿里云则以在线公共服务的形式,提供云服务器、云数据库、云安全、大数据、人工智能及行业解决方案。自2009年成立以来,阿里云已跻身全球前三大公共云服务提供商。

同时,阿里在2015、2016年间开始尝试Flink,积极布局并参与双11活动,甚至组建了上百人的团队,致力于技术推广。2019年,阿里以9000万欧元收购了Apache Flink的母公司Data Artisans,使Flink在Apache基金会中成为最活跃的项目之一,全球范围内的知名企业如优步、Netflix和微软等也逐渐开始使用Flink。

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

腾讯

2009年1月,腾讯建设了第一个Hadoop集群,正式开启了其大数据之路。

与阿里不同,腾讯的大数据业务主要围绕社交和游戏展开,拥有海量用户数据。

通过微信、QQ等社交工具,腾讯能够分析移动用户数据,建立用户画像并提供相应的营销服务。

此外,腾讯还开发了信鸽这一推送工具,旨在为社交用户提供消息推送服务。

虽然腾讯云起步较阿里云晚,当前在市场上仍落后于阿里云,但云计算市场的竞争如同马拉松,关键在于谁能坚持到最后。

在一次中国IT领袖峰会的对话中,李彦宏提到云计算本质上是重复已有的概念,而马化腾则认为云计算让计算能力的使用更为便利,尽管实现这一目标仍需时间。马云强调,云计算是当务之急,如果阿里巴巴不参与这一领域,其他竞争者将会将其挤出电商市场。

这段对话显示出马云的长远眼光,而李彦宏和马化腾尽管都是技术背景,但马云的视角更为前瞻。

另外,腾讯在技术宣传方面相对低调,技术人才不常出面,执行力却十分强大。腾讯的开发团队往往进行封闭式开发,集体加班已是常态,然而丰厚的激励措施也能有效推动团队的努力。

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

百度

在BAT中,百度提出大数据战略的时间最晚,但其举措频繁。

2013年,百度成立深度学习实验室,开始进军人工智能领域。

2014年,百度对外开放其大数据引擎,核心组成包括开放云、数据工厂和百度大脑,通过平台化和接口化的方式,开放大数据存储、分析和智能处理能力。作为全球首个开放大数据引擎,百度与多个传统领域展开合作。

同年8月,百度与联合国达成战略合作,共同建立大数据联合实验室,探讨利用大数据解决全球问题的新模式。

2017年3月2日,百度成立深度学习技术及应用国家工程实验室,成为国家级AI实验室。

与阿里和腾讯不同,百度的大数据布局更多集中在新兴方向,特别是人工智能领域,然而其大数据产品也包括数据分析、风险控制、数据营销等多个方面,布局较为广泛。

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

大数据领域分析

如今的大数据技术已经形成了完整的体系结构及应用方向,技术迭代速度迅猛,新框架不断涌现,应用方向日益细化,从业人员也在不断增加。

在大数据时代,海量数据、异构数据源和数据时效性等特征催生了大量新技术需求。因此,分布式计算框架如MPP应运而生,针对海量非结构化数据,出现了Hadoop、Spark等分布式批处理框架,而为满足实时处理需求,则有Flink和Spark Streaming等分布式流处理框架。

下图展示了Apache生态下的大数据框架:

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

未来,Apache生态中的大数据框架将会不断增加,大数据生态体系将愈发完善,这也意味着大数据的门槛将逐渐降低,越来越多的人将加入这一行业。因此,我们需要不断学习,在前期广泛学习的基础上,后期专注深入,磨练一技之长,达到极致。

应用层面:

在应用层面,大数据可分为金融大数据、营销大数据、交通物流大数据、医疗大数据、教育大数据和文娱大数据等多个领域。

接下来,我们将分析大数据科研和大数据企业两个方面:

1. 大数据科研

自2012年大数据广泛应用以来,产业界和学术界在相关技术和应用方面不断取得创新突破,论文发表数量迅速增长。

以下是2012-2020年全球大数据论文发表数量及各国占比:

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

数据来源:Web of Science,2020年10月

从图中可见,2018年论文发表数量达到顶峰,是2012年的5.4倍,年增长率为32.5%。然而,2019年后论文数量开始下降,预计2020年将进一步下滑,这表明随着科学研究的进展,大数据相关理论逐渐成熟,未来学术论文的增长速度可能会放缓。

在国家层面,中国和美国仍然是大数据学术研究的核心,发表的论文数量远超其他国家。未来在大数据领域,预计中国和美国将继续引领技术的发展。

再看看国内大数据产业的发展情况,根据工业和信息化部的数据,2019年我国基于云计算和大数据技术的平台类技术服务收入达到2.2万亿元,其中典型的云服务和大数据服务收入为3284亿元,提供服务的企业数量达到2977家,显示出大数据产业的日益壮大。

2. 大数据企业

大数据企业数量增长统计

分析BAT互联网巨头在大数据方向布局及大数据未来发展趋势

数据来源:中国信息通信研究院,2020年10月

从图中可以看出,国内大数据企业在2014年和2015年经历了爆发式增长,之后在2016年出现回落,这与我国大数据的发展状况相符。2014年被称为大数据元年,受国家政策推动,各大数据企业纷纷涌现,然而随着创业者的冷静,企业数量也逐渐减少。

是否有国资背景