华为芯片与系统详细梳理--Kirin麒麟 & Ascend昇腾 & Kunpeng鲲鹏 & HarmonyOS鸿蒙 & Euler欧拉

2025-06-19 08:36:232291

华为芯片与系统详细梳理--Kirin麒麟 & Ascend昇腾 & Kunpeng鲲鹏 & HarmonyOS鸿蒙 & Euler欧拉

1 概述2 芯片2.1 整体描述麒麟芯片(To C)【面向智能终端】昇腾芯片【面向AI计算】鲲鹏芯片【面向通用计算】

2.2 细分系列麒麟芯片(To C)与产品昇腾芯片与产品鲲鹏芯片与产品

2.3 详细介绍昇腾

3 系统3.1 整体描述鸿蒙系统(To C)欧拉操作系统(openEuler)

4 算力底座(以鲲鹏+昇腾作为算力底座)5 算力网络架构创新,打造全网一台计算机6 杂记TeraOPS(TOP)与 TeraFLOPS 区别芯片对比关键计算芯片华为全自研Hi1910 与 Ascend 310芯片 关系

参考

1 概述

华为致力于构建算力底座和系统软件生态,本文做了梳理。

2 芯片

华为芯片分多个系列:有麒麟、昇腾、鲲鹏,还有鸿鹄等。

2.1 整体描述

麒麟芯片(To C)【面向智能终端】

是华为用于智能手机的芯片解决方案,采用了华为海思先进的SoC架构和领先的生产技术。麒麟芯片主要面向高端旗舰手机市场,提供了强大的处理能力和优秀的功耗控制。

昇腾芯片【面向AI计算】

是华为推出的两款人工智能处理器,包括昇腾910和昇腾310。这些芯片主要面向人工智能领域,提供了强大的算力支持,可以广泛应用于各种AI应用场景。

鲲鹏芯片【面向通用计算】

是华为推出的服务器芯片,主要应用于数据中心和云计算领域。鲲鹏芯片采用了先进的制程技术和架构设计,提供了出色的性能和能效比。

2.2 细分系列

麒麟芯片(To C)与产品

麒麟旗舰系列芯片

麒麟中高端系列芯片

产品 各类高中低端手机、平板等。

昇腾芯片与产品

芯片 Ascend 310 Ascend 710 Ascend 910

产品 Atlas系列模块、板卡、小站、服务器、集群等产品。

RC(Root Complex)模式【主站】 & EP(End Point)模式【从站】

产业

生态

大模型

Atlas人工智能计算解决方案

鲲鹏芯片与产品

芯片 鲲鹏 920

产品 TaiShan服务器、鲲鹏主板及开发套件

生态

2.3 详细介绍

昇腾

昇腾芯片上集成了AI CORE、AI CPU和CPU。其中,AI CORE负责大型Tensor Vector运算,AI CPU负责标量运算,CPU负责逻辑控制和任务分发。

AI Core负责执行标量、向量和张量相关的计算密集型算子,包括三种基础计算单元:Cube(矩阵)计算单元、Vector(向量)计算单元和Scalar(标量)计算单元,同时还包含存储单元(包括硬件存储和用于数据搬运的搬运单元)和控制单元。

3 系统

华为有两大系列:鸿蒙和欧拉

3.1 整体描述

鸿蒙系统(To C)

是华为开发的分布式操作系统,旨在实现跨设备的无缝连接和协同工作。鸿蒙系统可以应用于手机、平板、电视等多种设备,为用户带来更加便捷的使用体验。

欧拉操作系统(openEuler)

是华为面向数字基础设施的操作系统,支持服务器、云计算、边缘计算等多种应用场景。欧拉操作系统致力于提供安全、稳定、易用的操作系统,支持多样性计算,推动企业数字基础设施软硬件、应用生态繁荣发展。

4 算力底座(以鲲鹏+昇腾作为算力底座)

5 算力网络架构创新,打造全网一台计算机

6 杂记

TeraOPS(TOP)与 TeraFLOPS 区别

TeraOPS (Tera Operations per Second):【缩写TOP】 TeraOPS 是每秒进行的操作数(OPS)的单位,其中“Tera”表示 10^12(即一万亿)。 它通常用于描述处理器或计算机系统的整体性能,但具体的“操作”类型可能因上下文而异。

TeraFLOPS (Tera Floating-Point Operations per Second): TeraFLOPS 是每秒浮点运算次数(FLOPS)的单位,其中“Tera”同样表示 10^12。 它专门用于描述系统在进行浮点运算(如科学计算、图形渲染等)时的性能。浮点运算是计算机中用于表示实数(如小数和分数)的运算。

芯片算力指标一般使用TeraOPS(Tera Operations per Second)而不是TeraFLOPS(Tera Floating-Point Operations per Second)的原因,主要是两者在定义和用途上有所不同。

首先,TeraOPS是一个更通用的度量单位,它表示每秒进行的操作数,这里的“操作”可以是任何类型的计算任务,包括整数运算、逻辑运算等,而不仅仅是浮点运算。这使得TeraOPS在评估芯片的整体性能时更为全面。

而TeraFLOPS则专门用于描述系统在进行浮点运算时的性能。浮点运算是计算机中用于表示实数(如小数和分数)的运算,在科学计算、图形渲染等领域中非常重要。然而,对于许多其他类型的应用来说,浮点运算并不是主要的计算任务,因此使用TeraFLOPS来评估芯片在这些应用中的性能可能不够准确。

芯片对比

关键计算芯片华为全自研

Hi1910 与 Ascend 310芯片 关系

什么是AI加速型弹性云服务器?

上述链接描述“每张Hi1910加速卡包含4个Ascend 310芯片”显示 Hi1910 包含 Ascend 310,具体包含几个,看实际应用。

参考

1、海思官网–麒麟(Kirin)芯片 2、海思官网–鲲鹏(Kunpeng)芯片 3、华为计算–鲲鹏计算 和 昇腾计算 4、华为微认证——鲲鹏处理器 5、鲲鹏官网 6、昇腾官网 7、民生证券-计算机行业深度报告-华为昇腾:国产AI算力“扛旗者”-230904 8、浙商证券-计算机行业华为算力产业链深度系列研究:华为昇腾服务器研究框架-230329 9、昇腾计算产业概述 10、华为–迈向智能世界白皮书 11、财通证券-计算机行业专题报告-华为产业系列深度:凤凰磐涅,AI昇腾-230827 12、华为Ascend昇腾计算产业概述 13、Atlas200 模组拆解 14、什么是AI加速型弹性云服务器? 15、华为Ascend昇腾基本架构