随着摩尔定律接近其极限,华为的下一个研发重点将是什么?是6G还是基础科学研究?在与《纽约时报》专栏作家托马斯·弗里德曼的对话中,华为创始人任正非被问及此问题。
任正非提到的重点是人工智能,这个答案或许让弗里德曼感到意外,因为它超出了他的预期。他强调,华为正在构建支持人工智能的硬件和软件平台。华为于9月18日发布的昇腾AI集群,拥有1024个节点,是目前全球最大、最快的人工智能平台。任正非指出,华为并不直接开发各种人工智能应用,而是提供一个平台,使整个社会能够利用AI。
在他看来,华为已成为人工智能领域的引领者,任正非向弗里德曼表示,尽管Google和英伟达也可以做到这一点,但华为目前的表现更为出色。他的自信流露无遗,正如他在讨论华为在5G领域领先于爱立信和诺基亚时所表现的那样。
任正非用简单的语言解释复杂的问题。当被问及人工智能未来对社会的影响时,他提到华为的生产线每20秒就能下线一部高性能手机,几乎不需要人工。未来将更加依赖自动化,人工介入将更少。在他们的讨论中,弗里德曼对此感到惊叹。
华为在人工智能领域的布局早在2017年底便已开始。当时,公司更新了愿景和使命,旨在将数字世界带入每个人、每个家庭、每个组织,建设一个万物互联的智能世界。2018年10月,在第三届华为全联接大会上,华为轮值董事长徐直军发布了AI战略及全栈全场景AI解决方案,涵盖了华为Ascend系列芯片及基于昇腾系列AI芯片的产品和云服务。他指出,昇腾系列是全球首个能够覆盖全场景的AI芯片。
徐直军详细阐述了华为的人工智能发展战略,强调持续投资基础研究和AI人才培养,构建全栈全场景AI解决方案并开放全球生态。内部方面,华为持续探索管理优化和效率提升;在电信运营商中,通过SoftCOM AI提升运维效率;面向消费者,通过HiAI使终端更智能;对企业和政府,提供华为云EI公有云服务及FUSionMind私有云方案,赋能各类组织使用AI;同时,面向全社会提供AI加速卡、AI服务器和一体机等产品。
在今年的华为全联接大会上,华为再次强调了全新的计算战略。副董事长胡厚崑表示,华为将从四个方面布局计算产业,包括架构创新、全场景处理器投资、商业策略的选择,以及推动开放生态的发展。
在大会上,人工智能成为再次被提及的主题。胡厚崑介绍了华为在AI领域的进展,昇腾处理器和AI计算框架MindSpoRe已发布,华为的全栈全场景AI解决方案也已全面落地。
回顾历史上的三次人工智能浪潮,行业内普遍认可,本轮AI发展受益于算法的进步、数据量的扩展以及算力的提升。实际上,人工智能的逻辑在于将大量数据输入先进的算法中,并依靠强大的算力输出结果。
算力在人工智能时代的重要性显而易见,然而,随着AI的快速发展,算力的需求每年以十倍的速度增长,供给却显得捉襟见肘。
在算力稀缺的背景下,云计算的重要性愈加凸显,华为云在很大程度上承载着华为在人工智能时代的目标,旨在为全球提供最强算力,实现云的无处不在和智能的无所不及。
算力稀缺的时代
过去几十年,计算机的计算模式经历了巨大的变革。为了解决一些无法用确定规则描述的问题,科学家找到了一种基于统计的计算模式,这也成为当前人工智能发展的基石。
胡厚崑认为,这种基于统计的计算模式将逐渐成为主流。他预计,五年后,AI计算将占全社会算力消耗的80%以上。
为了让计算机识别一只猫,需要数百万张图片进行训练,这对算力的消耗是巨大的。在自动驾驶、天文探索、气象预测等更复杂的场景中,对算力的需求将更为迫切。胡厚崑形容统计计算(人工智能)对算力的高度依赖为“暴力计算”。
华为云业务总裁郑叶来表示,当前AI快速发展,对算力的需求每年增加约10倍,而一些新算法如BIgGAN的算力需求更是呈现百倍增长。因此,算力应该像电力一样随时可得。
云计算是让算力像电力一样随时可得的解决方案。业内专家指出,以往需要算力的机构通常会购买服务器,自己搭建计算中心,但随着云服务的出现,更经济的云服务逐渐成为主流。
人工智能的应用需要一种新的算力,而云服务提供的算力将从通用算力转向以AI算力为主。关键在于处理器的效能,随着摩尔定律接近极限,必须从处理器架构上寻求突破,以满足AI对算力的快速增长需求。
华为与其他云服务商一样,曾提供基于英特尔X86架构的通用算力云服务。面向人工智能时代,华为自研了达芬奇架构,声称其为业界唯一覆盖端、边、云全场景的处理器架构,成为华为计算产业的基础。
基于达芬奇架构,华为在去年推出了主要用于边缘计算的AI芯片——昇腾310,而在今年8月,又发布了支持全场景人工智能应用的AI芯片——昇腾910。
随着昇腾910的发布,华为宣布其全栈全场景AI解决方案已全面落地。全栈方案涵盖芯片、芯片使能、训练与推理框架以及应用使能,提供技术支持;全场景则指公有云、私有云、边缘计算、物联网终端及消费类终端等多种部署环境。
在云业务方面,华为今年推出了重磅产品Atlas 900。根据华为的公开介绍,Atlas 900 AI训练集群由数千颗昇腾910 AI芯片互联构成,是当前全球最快的AI训练集群,总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。
在ResNet-50模型训练的权威标准下,Atlas 900仅用59.8秒完成训练,比原世界纪录快了10秒,相当于短跑冠军完成终点,喝完一瓶水后才等到第二名。
Atlas 900的成功得益于高性能的昇腾910 AI芯片,但华为选择以云服务的形式面向客户,而不是单独出售芯片。根据了解,华为目前已将Atlas 900部署到华为云,并以优惠价格向全球科研机构和大学开放。
当然,Atlas 900并不是华为云在人工智能领域提供的唯一服务,基于昇腾910和310 AI芯片,华为还推出了AI训练服务器Atlas 800、智能小站Atlas 500、AI推理与训练卡Atlas 300及AI加速模块Atlas 200,完成了Atlas全系列产品的布局,覆盖云、边、端全场景,提供训练和推理的算力。华为希望通过统一的达芬奇架构和全场景AI计算框架,实现云、边、端的协同,加速全行业的智能化转型。

华为Atlas全系列产品
华为云的“黑土地”定位
在人工智能和云服务的建设上,华为正努力追赶时代。任正非于2018年在华为GTS人工智能实践进展汇报会上,将华为云定位为可供生态伙伴“种庄稼”的“黑土地”。
过去一年,华为云这块“黑土地”上确实收获颇丰。郑叶来透露,华为云EI在城市、制造、医疗、汽车、园区、互联网等10个行业的500多个项目成功落地,助力企业智能化升级。
在此过程中,华为云团队不断总结经验,以帮助生态伙伴在这块“黑土地”上种出“庄稼”。
郑叶来表示,在500多个项目实践中,华为云发现行业AI项目成功实施的关键在于应用场景、相关ISV/SI、设备或流程及AI平台提供方之间的协作,并需具备四个要素:明确的商业场景、强劲的算力、持续进化的AI服务,以及组织与人才的匹配。
此外,华为云还在尝试将这些经验应用于特定行业。例如,针对工业制造业,华为云推出了工业智能体。华为云表示,工业智能体是行业智能化升级的新引擎,能够通过知识图谱的智能认知引擎、AI模型的智能预测引擎及运筹规划的决策优化引擎,推动智能化发展。
