计算机行业专题报告：大模型推理算力知多少？

当前位置：首页 > 滚动 > >正文

计算机行业专题报告：大模型推理算力知多少？

来源：研报中心时间：2023-08-24 08:30:13

X 关闭

(相关资料图)

Transformer生成为访存密集型任务，显存及其带宽限制算力利用。

Transformer作为自回归模型，生成每一个新的token，都需要将所有输入过的token反复计算，实际产业中，会将已经计算过的量（K、V值）预存下来，避免重复计算，导致每生成一个token，都需要与显存进行数据交互（访存），导致相比计算，Transformer模型在生成过程中对访存的需求更高。目前全球最先进AI芯片的计算速度“远快于”显存带宽。我们认为，针对大模型推理这类访存密集型任务，对其算力需求的估计，不能单单考虑其FLOPs的需求，更重要的瓶颈在于访存。

目前的优化手段主要是在算力成本与用户体验之间做平衡。实践中有大量优化技术以克服GPU利用率低的问题，但存在一定取舍，总结而言，在不做模型精简的情况下，GPU利用率与时延难以同时兼顾。而做参数量化、模型蒸馏等模型精简看似可以做到“兼顾”，但却舍弃了模型本身的效果。我们认为，高昂的推理算力成本是阻碍以GPT为代表的LLM模型应用大规模落地的重要原因之一，后续随着算力性价比不断提升，大模型应用发展前景广阔。

支撑GPT-3.5推理任务的A100数量或至少在5万张左右。根据我们测算，若以GPT-3.5当前的流量情况以及token生成速度，大约需要5万张左右的A100才能承载推理。而如果再考虑到：1.当前全球流量最高的网站月活水平；2.更高的精度以发挥更好的模型效果；3.GPT-4若想要解开限制等因素，推理算力的需求或为长期高景气，同时当前高昂的成本是阻碍应用大规模落地的主要因素之一。

英伟达L40s开启降本第一步，应用有望加速落地。L40s在特定场景下性价比超越A100，供货周期较短。我们认为，L40s的发布首先将为英伟达及其算力产业链相关企业带来更快的实际业绩受益，而非难以交付的“高增长订单”。同时，非超大型模型端的降本有望加速应用（或尤其图像领域）大规模落地。在千亿级甚至以上参数的超大模型训练与推理方面，A/H系列仍具有不可代替的能力，L40s的发布既填补了一部分腰部客户需求，但以科技巨头需求为主的A/H系列芯片又仍将需求旺盛。

投资建议：见正文

风险提示：AI技术迭代不及预期的风险，商业化落地不及预期的风险，政策支持不及预期风险，全球宏观经济风险。

X 关闭

最近更新

计算机行业专题报告：大模型推理算力知多少？

2023-08-24 08:30:13

滚动
《努努之歌：英雄联盟外传》发布剧情预告

2023-08-24 06:51:17

滚动
科技潮品再革新三星Galaxy Z Fold5开启多彩生活

2023-08-24 03:19:20

滚动
江华涔天河镇会合村开展“金秋爱心助学，助力乡村振兴”助学活动

2023-08-23 22:29:42

滚动
印媒：印度“月船3号”月球探测器成功着陆

2023-08-23 21:02:06

滚动
假如你不生我不生，人口低至七亿，我们的日子会变得更好过吗？

2023-08-23 19:23:46

滚动
吉山会津（837576）：2023年上半年净利润836.99万元，同比增长14.92%

2023-08-23 17:58:25

滚动
波长光电正式登陆创业板发行价为29.38元/股

2023-08-23 16:25:01

滚动
淡水养出“海味”来南美白对虾受青睐

2023-08-23 15:06:00

滚动
科陆电子2023上半年储能营业收入约1.36亿元

2023-08-23 14:02:12

滚动
东盟采购网（东盟采购）

2023-08-23 12:19:36

滚动
启动登山节、发放登山护照济南将启动“一城山色”市民登山系列活动

2023-08-23 10:57:22

滚动
陈都灵穿镂空黑裙露细腰长腿发丝飞舞红唇吸睛

2023-08-23 09:27:07

滚动
咸宁市工商联联合多部门搭建服务平台当好企业“娘家人”

2023-08-23 08:31:11

滚动
四川荣县试点城市森林花园住宅：每户设置1处外挑空中花园

2023-08-23 06:38:06

滚动
莱芜钢铁集团建筑安装工程有限公司志愿服务队(关于莱芜钢铁集团建筑安装工程有限公司志愿服务队的简介)

2023-08-23 02:16:26

滚动
济宁市市场监督管理局发布关于医药领域商业贿赂线索举报的公告

2023-08-22 22:14:39

滚动
vivo Pad Air图赏：一体化无缝金属机身，诠释轻薄全能

2023-08-22 20:49:07

滚动
A股迎V型反弹 “市场底”到了吗？

2023-08-22 19:26:04

滚动
每体：德科认为巴萨没签弗雷斯内达将是错误，球员身价可能暴涨

2023-08-22 18:04:33

滚动
鹤壁市示范区淇水湾街道：创建“三零”平安社区保持辖区和谐稳定

2023-08-22 17:08:34

滚动
波音737NG机身出现裂缝美航空管理局将要求展开检查

2023-08-22 16:04:28

滚动
广东一地惊现“龙吸水”，画面震撼

2023-08-22 15:11:27

滚动
日中新闻社（关于日中新闻社的基本详情介绍）

2023-08-22 14:03:32

滚动
欧洲篮球，超级高水平！

2023-08-22 12:31:14

滚动
海阔天空·国瑞城房价继续上涨，海口房价下跌已成定局是真的吗

2023-08-22 11:42:49

滚动
汇成股份：8月21日融资买入416.37万元，融资融券余额8416.6万元

2023-08-22 10:54:34

滚动
真我 Buds Air5耳机曝光：颠覆干元级旗舰降噪

2023-08-22 10:16:23

滚动
美的工业技术高创携机器人解决方案亮相2023世界机器人大会

2023-08-22 09:21:09

滚动
奥特佳08月21日被深股通减持84.52万股

2023-08-22 08:12:15

滚动
于正评价大明风于正评价大明风华

2023-08-22 06:27:12

滚动
安全责任无小事！(关于安全责任无小事！简述)

2023-08-22 02:26:37

滚动
日照高新区：阳光链上的“数字力量”

2023-08-21 22:14:26

滚动
瑞凌股份2023年上半年净利7087.32万同比增加50.19%

2023-08-21 20:52:11

滚动
神马股份：设立全资子公司龙安化工

2023-08-21 19:16:41

滚动
全球最大的光伏发电项目敲定融资安排中国能建有望承建

2023-08-21 18:28:40

滚动
光影舞台剧《影箱奇旅》周四首演

2023-08-21 17:22:13

滚动
多地餐厅“七夕”线上订座量翻倍，上海、北京、杭州领衔浪漫消费力

2023-08-21 16:17:21

滚动
泸州警校学费一年多少钱（泸州警校）

2023-08-21 15:15:17

滚动
覆盖沿海人员密集、网红打卡地等景点！青岛加密布设救生器材柜

2023-08-21 14:13:33

滚动
博德之门3奥林在哪博德之门3奥林位置介绍

2023-08-21 13:03:43

滚动
经济随笔丨沪苏的地铁与东北六市的“抱团儿”

2023-08-21 11:55:05

滚动
《纽约时报》禁止其新闻用于AI模型训练

2023-08-21 10:55:54

滚动
我的世界攻略手册（我的世界攻略）

2023-08-21 10:09:38

滚动
海口开始经济普查单位清查入户登记工作

2023-08-21 09:08:12

滚动
年年岁岁花相似岁岁年年人依旧（年年）

2023-08-21 07:14:43

滚动
驾照考试科目二和科目三一共可以考几次（驾照科目二和科目三可以考几次）

2023-08-21 03:10:10

滚动
神秘的白色下一代Xbox控制器在线出现

2023-08-20 21:56:24

滚动
男子晨跑竟跑上快车道轿车避让不及发生碰撞

2023-08-20 19:30:04

滚动
湖南桃江一游客被吸入水上乐园排水口身亡景区暂停营业

2023-08-20 17:26:48

滚动
钢铁直男！女子晒男友家都是不锈钢家具，当事人：为了防甲醛

2023-08-20 15:38:51

滚动
几款ip地址更换器推荐 ip地址概念及更换方法

2023-08-20 13:23:30

滚动
益阳市中心医院举行第六届中国医师节庆祝暨表彰大会

2023-08-20 11:31:31

滚动
畅通基层治理“毛细血管” 多地创新服务为群众办实事

2023-08-20 10:02:14

滚动
初中生泄露明星隐私闯下大祸？爸爸紧急报警……

2023-08-20 07:59:28

滚动
车载半导体市场的实际情况

2023-08-20 03:59:09

滚动
闹大了！《中国好声音》更多内幕曝光，普通人根本玩不起！

2023-08-19 22:13:20

滚动
封面有数丨中国MCN机构数量超2.4万家，红人新经济向多赛道下沉

2023-08-19 19:53:38

滚动
第三条塔克拉玛干沙漠公路启用智能气象站

2023-08-19 17:28:06

滚动
原声轰鸣！空中第一视角看台岛周边演训

2023-08-19 15:28:52

滚动
洛川县关工委携手爱心企业开展捐资助学活动

2023-08-19 13:15:50

滚动
铭鑫gt220和影驰gt610（铭鑫gt220）

2023-08-19 11:16:24

滚动
“国家队”入场破解电动自行车充电难今年将在广东建20万个充电桩（柜）

2023-08-19 09:55:57

滚动
新闻8点见丨北京发布电动三轮车新规；中泰缅老警方合作打击赌诈集团

2023-08-19 08:16:51

滚动
矿权转让合同委托律师参考价格

2023-08-19 06:09:21

滚动
蓝光(关于蓝光简述)

2023-08-19 01:19:44

滚动
梅县区大坪小龙虾美食节顺利举办带旺乡村旅游消费

2023-08-18 22:12:42

滚动
8月18日石脑油产业链情报

2023-08-18 20:30:06

滚动
曙光英雄许褚怎么样曙光英雄许褚介绍

2023-08-18 19:06:54

滚动
《塞尔达传说：王国之泪》攻略书陆续上架：9月发售！

2023-08-18 17:22:07

滚动
网签合同的有效期是多长时间,法律上有哪些规定

2023-08-18 16:01:21

滚动
成都金银街周五（8月18日）黄金价格报价573元/克

2023-08-18 15:02:44

滚动
续航523km/明年上市全新讴歌ZDX官图

2023-08-18 13:26:55

滚动
周五银银间回购定盘利率全线上涨(08-18)

2023-08-18 11:59:30

滚动
神圣象征、伦理抒情与地方史诗——《凉州十八拍》

2023-08-18 10:38:06

滚动
8只股票型ETF份额增加超2亿份，华夏上证科创板50成份ETF增加10.8亿份

2023-08-18 09:17:25

滚动
三角插片怎么折三角巧克力插片怎么做

2023-08-18 08:21:01

滚动
吉利雷达出海进行时，首批纯电皮卡RD6起航

2023-08-18 06:39:37

滚动
信用卡欠了14万还不上求解决方法

2023-08-18 03:05:33

滚动
森鹰窗业：上半年归母净利润同比上涨79.83% 计提减值准备共计1654.42万元

2023-08-17 22:19:46

滚动
连续大赛带来高曝光，奢侈品牌资源向体育界倾斜

2023-08-17 21:04:04

滚动
新传企划(01284.HK)拟8月29日举行董事会会议批准中期业绩

2023-08-17 19:12:57

滚动
福耀玻璃(03606)公布上半年业绩归母净利约28.36亿元同比增长19.07%

2023-08-17 18:00:20

滚动
孙绍骋“走边关”：5天行车1800公里

2023-08-17 16:29:28

滚动
dnf男气功刷图加点（怎么加点最好）

2023-08-17 15:07:50

滚动
仓储物流板块午后异动长久物流接近涨停

2023-08-17 13:42:36

滚动
驯良的反义词是什么（驯良的反义词）

2023-08-17 12:01:38

滚动
聚焦张家口探源北方旱作农业

2023-08-17 10:34:14

滚动
人间地狱！常州恐怖分尸案细节曝光，知情人曝惊人内幕！

2023-08-17 09:29:26

滚动
云南白药08月16日获深股通增持155.18万股

2023-08-17 08:20:23

滚动
专访‖NI高级副总裁Drita Roggenbuck：NI在极速发展中引领汽车测试技术变革

2023-08-17 06:32:33

滚动
辛集职教中心（关于辛集职教中心的基本详情介绍）

2023-08-17 03:01:46

滚动
这很拜仁！高尔夫评级领跑全队，凯恩：穆勒已要求和我打一场

2023-08-16 22:18:21

滚动
京东集团2023年二季度核心指标超预期，低价战略与商家生态取得阶段性成果

2023-08-16 21:03:51

滚动
【鹤云】苦

2023-08-16 19:16:39

滚动
润和软件：“AI+信创”！上半年创新业务商业落地初见成效

2023-08-16 17:58:47

滚动
伍德麦肯兹：华为和阳光电源保持逆变器市场主导地位 2022年份额超50%

2023-08-16 16:15:33

滚动
荣耀Magic V2 Lite曝光：9月发布搭载高通骁龙8+

2023-08-16 15:16:46

滚动
特斯拉自动驾驶 FSD 着手入华：正在建立团队

2023-08-16 13:37:07

滚动
大行评级｜大摩：予五矿资源目标价2港元评级“减持”

2023-08-16 11:58:59

滚动

计算机行业专题报告：大模型推理算力知多少？

推荐内容

最近更新