互联网资讯 / 人工智能 · 2023年11月14日 0

AI芯片初创企业的发展路径研究

近年来,AI芯片初创企业如雨后春笋般崛起。如今,部分早期投资的公司已逐渐成熟,开始通过推出各种模块和芯片卡来扩展产品线。同时,它们凭借卓越的芯片设计和全球分销网络,建立起了市场竞争的优势。

AI芯片初创企业的发展路径研究

HAIlo模块

以色列的AI芯片初创企业HAIlo推出了两款基于HAIlo-8 AI加速器芯片的模块,专注于边缘应用。这些模块采用标准的M.2和Mini-PCIe格式,适用于智慧城市、智能零售、智能家居及工业4.0等无风扇“边缘设备”场景。这些设备专门用于执行多视频流分析等任务,旨在通过边缘部署降低延迟,并避免数据集中带来的隐私问题。

HAIlo-8的“结构定义数据流”架构使其在性能上达到3 TOPS/瓦,具备26 TOPS的处理能力。该芯片获得了车载级应用许可,适用于ASIL-B标准,并通过AEC-Q100 GRade 2认证。

最近,HAIlo发布了新数据显示,其模块在多项性能基准测试中全面超越了英特尔MyRiad-X和谷歌Edge TPU(CoRal M.2)模块。考虑到HAIlo-8高达26 TOPS的性能,而对手的峰值性能仅为4 TOPS,这样的结果并不意外。令人惊讶的是,HAIlo的内部测试显示,谷歌Edge TPU模块的平均性能是参数相似的英特尔MyRiad-X模块的两倍。

HAIlo芯片正与市场领军者直接竞争,图中柱状图展示了各模块的每秒处理帧数。

HAIlo-8已被应用于富士康的边缘设备BOXiedge,该设备专注于边缘视频处理。这款无风扇设备配备了Socionext提供的SynQuACER SCA11并行处理器,加上HAIlo-8,用于加速深度学习推理。

这家2017年成立的特拉维夫公司目前拥有超过100名员工,至今已从NEC和ABB等战略投资者那里筹集到超过8800万美元的资金。

GRoq卡

GRoq正在以服务器节点形式销售其张量流处理器(TSP)芯片,该芯片集成了8张PCIe卡,旨在快速执行数据中心内的AI推理。GRoq的TSP达到1 POPS(1000 TOPS),成为业界最强大的TSP之一。根据GRoq的数据,在ResNet-50 v2数据集上,批次大小为1的测试中,其可达到18900 IPS(每秒推理次数),无疑是目前速度最快的商用AI加速器芯片。

GRoq的处理器设计简洁,软件层面执行任务规划。其编译器负责协调数据流和时序,确保计算过程的连续性,从而提升延迟和性能的可预测性。

该公司最近获得了新的资金支持,但未透露具体金额。此外,GRoq还暗示正在扩展市场,包括汽车产业。

GRoq节点包含8个TPU芯片的5U设备,提供高达6 POPS的AI推理性能。

新款GRoq节点整合了8块GRoq卡(8个TPU芯片),具备6 POPS性能,尺寸为5U,功耗为3.3千瓦。GRoq表示,这种性能与功耗的良好平衡将使其在优化数据中心的总体拥有成本(TCO)方面具有显著优势。

GRaphcoRe分销网络

英国的AI加速器初创企业GRaphcoRe已正式建立全球渠道合作伙伴网络。

作为2018年首批推出芯片产品的公司之一,GRaphcoRe在今年夏季发布了第二代芯片。ColoSSUS MaRk 2的推出,标志着GRaphcoRe与市场领先者英伟达的竞争野心,其在数据中心内可提供高达约250 TFLOPS的AI训练性能。GRaphcoRe的系统级解决方案IPU设备为1U服务器刀片,内部包含4块ColoSSUS MaRk 2芯片,能够提供FP16精度的Petaflop级AI计算能力,并支持16台IPU设备串联或并行运作。

GRaphcoRe的IPU-POD配备了16台面向HPC应用的IPU设备(共64块IPU芯片)。

GRaphcoRe表示,其IPU已经在金融服务、医疗健康、消费互联网、学术研究等多个领域得到了实际应用。

GRaphcoRe的“精英合作伙伴计划”旨在建立一个IPU设备的分销商和转售商网络。合作伙伴包括服务器制造商如戴尔、浪潮、2CRSI,以及科学超级计算机制造商Atos,欧洲分销商Boston LiMITed,系统集成商BSI,中国分销商Digital China,科学计算分销商Lambda,香港的Macnica Cytech,面向美国联邦政府客户的Meadowgate Technologies,韩国分销商Megazone,英国HPC技术分销商OCF,HPC服务器制造商Penguin Computing,分销商Tech Data Europe和US,以及关键任务/美国政府专业供应商Wildflower International等。