← 返回列表

达芬奇架构

达芬奇架构
芯片华为AINPU

达芬奇架构

达芬奇架构(Da Vinci Architecture)是华为海思自研的 AI 计算架构,专为深度学习和神经网络推理设计,广泛应用于麒麟手机 SoC、昇腾 AI 加速芯片和鲲鹏服务器芯片的 NPU 模块中。达芬奇架构于 2017 年随 Kirin 970(全球首款独立 NPU 手机芯片)首次亮相,是华为在端侧 AI 领域的核心技术壁垒。

核心设计

3D Cube 计算单元

达芬奇架构最核心的创新是三维矩阵乘法加速器(3D Cube)。传统 GPU 做矩阵乘法需要将三维数据"扁平化"为二维后在流处理器上执行,而达芬奇的 Cube 单元天然支持三维矩阵运算,在 INT8 精度下实现极高的推理吞吐量。这一设计专门为卷积神经网络(CNN)的卷积运算和 Transformer 模型的自注意力机制优化。

统一张量指令集

达芬奇架构采用三级计算单元协同调度: - 标量单元(Scalar) :处理控制流和标量运算 - 向量单元(Vector) :处理向量级运算(激活函数、归一化等) - Cube 单元:处理矩阵乘法(卷积层和全连接层的核心运算)

三者通过统一指令集调度,编译器可以自动将 AI 模型的不同算子映射到最优计算单元。

达芬奇架构代际演进

代际首款芯片年份制程代表设备关键提升
第一代Kirin 970201710nmMate 10 Pro单 NPU,1.92 TOPS(FP16)
第二代Kirin 98020187nmMate 20 Pro双 NPU,推理速度翻倍
第三代Kirin 990 5G20197nm+ EUVMate 30 Pro大核+微核异构,能效大幅提升
第四代Kirin 900020205nmMate 40 Pro2×大核 + 1×微核三核 NPU,端侧 AI 大幅增强
第五代Kirin 9000S20237nmMate 60 Pro持续优化,支持端侧大模型推理

端侧 AI 应用场景

计算摄影

达芬奇 NPU 是华为手机影像能力的关键算力支撑: - 场景识别:实时识别超 1500 种场景(人脸/宠物/食物/建筑/天空等),自动调优参数。 - 语义分割:将画面分解为人像、天空、前景等区域,分别处理曝光和色彩。 - 多帧降噪:手持夜景模式下实时合成和降噪处理。 - 视频实时渲染:视频拍摄时的人像虚化、AI 滤镜等。

语音与自然语言

- 小艺语音助手 的端侧唤醒词检测和离线语音识别。 - 实时翻译:通话翻译、面对面翻译的端侧推理,数据不出设备。 - AI 字幕:视频通话和媒体播放中的实时转写。

隐私与安全

因为 NPU 提供高效的端侧推理能力,敏感数据(人脸模型、声纹、使用习惯)可以在本地处理,无需上传云端,是华为隐私保护体系的技术基础。

系统级 AI

- AI 节电引擎:学习用户使用习惯,智能管理后台应用和 CPU 频率。 - 智能资源调度:预测用户即将打开的应用,提前预加载。 - HarmonyOS 智慧推荐:服务卡片和原子化服务的智能推荐。

昇腾系列:数据中心级达芬奇

达芬奇架构同时应用于华为昇腾(Ascend)AI 加速芯片,面向云端训练和推理:

芯片定位算力(FP16)应用
昇腾 310边缘端推理16 TOPS智能摄像机、边缘服务器
昇腾 910云端训练320 TFLOPSAI 训练集群、华为云 ModelArts

昇腾系列支撑了华为盘古大模型的训练和推理,与麒麟芯片的端侧 NPU 形成"端-边-云"统一的达芬奇架构生态。

相关笔记

- 华为手机 - 麒麟芯片 - 海思 - 小艺 - HarmonyOS