首页 行业研究 正文

AIGC系列之七:国产AI芯片的百倍算力需求!

扫码手机浏览

本期投资提示: AI 芯片是大模型的基础。AI 芯片主要分为训练和推理两类芯片,云和端对训练和推理芯片要求不同,目前主流架构包括GPU、FPGA 和ASIC 三类,通用性GPU>FPGA>ASIC,性能功耗比GPU

机构:上海申银万国证券研究所有限公司

作者:黄忠煌,洪依真,李国盛,刘洋

本期投资提示:
AI 芯片是大模型的基础。AI 芯片主要分为训练和推理两类芯片,云和端对训练和推理芯片要求不同,目前主流架构包括GPU、FPGA 和ASIC 三类,通用性GPU>FPGA>ASIC,性能功耗比GPU四大AI 芯片技术路线,均围绕打破英伟达CUDA 生态垄断展开。英伟达凭借CUDA、cuDNN 和TensorRT 等软件工具链以及和Tensorflow 的深度绑定构筑了极高的生态壁垒,2021 年GPU 市占率超80%,高性能AI 芯片A100、H100 被禁止向中国出口后,快速推出800 系列合法出口中国;寒武纪复制英伟达成长之路。
GPT-4 参数量高达100 万亿,是GPT-3 的500 倍以上!即使考虑到AI 芯片能力的提升(从当前主流的A100 升级至H100),仍然需要巨量的额外增量投资。
AI 芯片+AI 服务器,受益于AIGC+类GPT 等应用的“鲶鱼效应”。原有英伟达等供给有限,所以国产AI 芯片有理论上的爆发弹性,AI 服务器有成长空间。由于AIGC、类GPT有“鲶鱼效应”,带来约百倍算力需求。而英伟达等供给解决需求有瓶颈(根据IDC 咨询,预测2025 年AI 服务器市场空间仅仅318 亿美元,21-25 年预计CAGR 仅仅19.5%),因此国产AI 芯片在逻辑上有爆发弹性,此外AI 服务器也有成长空间。
寒武纪思元590 将是最早实现商业应用的接近英伟达A100 性能的国产AI 训练芯片。目前华为昇腾910 性能超越英伟达V100,但未达到A100 水平,壁仞科技7nm通用GPU芯片BR100 称其可与被禁售的英伟达H100 一较高下,但尚未量产上市。寒武纪思源590芯片面积800mm^2,和A100 一样。内存带宽2.7T,是A100 1.8T 的1.5 倍。HBM2使用海力士,功耗达350W-550W,FP32 算力到80TFLops,目前已经客户送样测试阶段,在高性能国产AI 芯片中进程最快,最有机会承接国内AI 算法商对英伟达A100、H100的需求。
重点推荐:1)直接受益AI 芯片需求崛起的寒武纪(思元590 将是最早实现商业应用的接近英伟达A100 性能的国产AI 训练芯片)、海光信息(预计2023 年底量产的DCU3 性能与NVDIA H100 性能持平)。2)AI 服务器供应商:浪潮信息、中科曙光、中兴通讯(通讯)、工业富联(电子)。
TMT 领域算力基建逻辑,也建议关注通信、电子相关公司。
通信——天孚通信、中际旭创、紫光股份、锐捷网络、新易盛等。此外也持续关注流量基建主线的数据中心等环节供需变化,包括奥飞数据、润泽科技等,以及伴随算力增长的温控散热环节,英维克等。
电子——GPU:景嘉微、好利科技;视觉芯片及IP:思特威、富瀚微、芯原股份;服务器存储及接口芯片:澜起科技、聚辰股份;CPU:海光信息、龙芯中科;FPGA 芯片:复旦微、安路科技;数通/服务器PCB:沪电股份、深南电路、生益科技、胜宏科技;光通信芯片:源杰科技。
风险提示:AI 芯片迅速迭代,开启价格战;AIGC 行业落地需求不及预期;供应链不稳定。

阅读全文

本文转载自互联网,如有侵权,联系删除

相关推荐

推荐文章