目前,AI模型的开发与生产部署阶段面临着多重挑战。AI模型在上线之前需要经过大量的调试和测试,这一过程通常耗时2至3天。此外,AI在线服务的计算资源通常较为固定,导致在突发需求时响应缓慢,给业务扩展带来困难。企业亟需一种能够无缝连接AI模型训练和推理部署的解决方案,以高效调度资源并管理模型,从而缩短业务上线周期。浪潮人工智能开发平台AIStation,正是为企业提供应对这些挑战的理想工具。
浪潮AIStation是一款专为企业级AI生产环境设计的开发平台。之前的浪潮AIStation训练平台通过细致的计算资源调度、训练数据缓存加速和分布式训练的自动编排等策略,将用户的AI计算资源利用率提升至90%以上,显著缩短了模型开发周期,并已得到广泛应用。
在2020年4月9日的浪潮云数据中心合作伙伴大会上,浪潮推出了最新的AIStation推理平台。这一平台能够实现推理服务资源的灵活调配,支持多源模型的统一调度,使得模型部署时间从几天缩短至几分钟。这将极大地帮助企业轻松部署AI推理服务,并显著提升AI的交付和生产效率。随着AIStation推理平台的推出,AIStation资源平台全面支持训练与推理两大场景,实现从模型开发到训练、部署、测试、发布及服务的全流程一站式高效交付。

AIStation推理平台支持本地On-Premise和云端Cloud部署,确保服务的可用性和业务的连续性。它实现了AI模型从开发环境到生产部署的自动化操作,将模型部署时间从两三天缩短到几分钟。
在资源调度方面,AIStation推理平台能够灵活调配服务资源。采用创新的弹性可伸缩架构,可以根据推理服务资源需求的变化及时调整资源分配,缩短响应突发需求的实例部署时间,从几小时减少至几分钟。同时,它支持新模型发布前的A/B测试,能够在实际业务场景中验证模型的有效性,确保推理业务的安全和可靠,并避免流量切换带来的集群负载压力。
在模型管理方面,AIStation推理平台实现了多源模型的统一调度。通过统一平台管理多源和多场景模型的推理服务,实时监控全局资源,实现模型服务的综合调度和动态部署。同一资源池可同时支持多家模型服务,使资源利用率从40%提升至80%。此外,该平台支持多模型加权评估,通过对不同预训练模型的计算结果进行自定义权重设置,有效提升实际业务场景中的预测结果可靠性,构建可信赖的智能系统,有效降低误判率。

浪潮AI&HPC总经理刘军表示:“智算中心是人工智能新基建,它生成和提供人工智能计算力,是社会经济运行的智慧基础设施。要让智算中心充分释放算力,就必须按需灵活调度算力。AIStation对于智算中心新基建的重要性,相当于电厂和电网的核心调度系统,它能够根据AI应用需求高效调度AI算力资源,帮助企业加速AI研发创新,提升AI生产交付效率,让企业更专注于AI开发本身,从而激发更多创新可能,加速AI的实际应用落地。”
浪潮是人工智能计算领域的领导品牌,AI服务器在中国市场的份额超过50%。它与人工智能领先科技公司保持紧密合作,在系统与应用方面不断深入,帮助AI客户在语音、语义、图像、视频、搜索和网络等领域实现显著的应用性能提升。浪潮与合作伙伴共同构建元脑生态,分享AI计算、资源和算法三大核心平台能力,助力行业用户开发并部署属于自己的“行业大脑”,加速推进产业AI化的落地。
