乌镇峰会观察:AI时代到来 算力难题何解?
2024-11-29 10:11      作者:李玉洋     来源:中国经营网

本报记者 李玉洋 上海报道

秋末冬初,橙黄橘绿时,2024年世界互联网大会乌镇峰会如约而至。尽管乌镇峰会已落幕,但水乡桨声依旧激荡着数字浪潮,开启了互联网发展“下一个十年”的续篇。

今年的乌镇峰会,AI浓度相当高。AI算法模型、AI数据算力、AI场景应用,这三个展区占据了约半个“互联网之光”博览会展馆,吸引了不少观众前来打卡和体验。

比如华为展示了“鸿蒙/欧拉软件”“鲲鹏/昇腾硬件”两大根生态;腾讯将全链路自研大模型“混元”、AI助手“腾讯元宝”和“腾讯元器”送到观众面前;阿里巴巴则展示了“通义”大模型在多个领域的创新应用。

《中国经营报》记者注意到,今年10月下旬,一篇题为“英伟达H100 GPU海外租金价格降至2美元/小时”的文章在国内迅速传播,一时间出现“算力泡沫是否开始破裂”“H100算力不香了”等话题。作为AI/大模型进化的动力,国内算力还够用吗?智能算力建设情况如何?

在乌镇峰会一分论坛上,中国工程院院士、之江实验室主任、阿里云创始人王坚表示,算力仍是进入人工智能领域的最大障碍之一。若是要用一个技术指标来衡量新质生产力,也绕不过算力。

官网显示,之江实验室成立于2017年9月,是由浙江省人民政府主导、浙江大学等院校支撑、企业参与的事业单位性质的新型研发机构,主攻智能感知、人工智能、智能计算、智能网络和智能系统五大科研方向,重点开展前沿基础研究、关键技术攻关和重大装备系统研发。据了解,之江实验室已成功点亮浙江新型算力中心首期千卡集群、基础万卡集群。

之江实验室展台一名工作人员告诉记者,从他们了解到的情况来看,国内算力的增长还是跟不上大模型发展的速度。而国内电信运营商人士坦言,为满足政府客户的需求,现在国内算力还是远远不够的。

“我们客户一般还是会面临算力问题,CPU基础算力没问题,缺GPU算力。”国内一家深耕智能客服领域公司的大模型产品负责人表示,华为昇腾910B对标英伟达A100,价格在约25万元一张,而租用行情价差不多一张每月2万元。

上述大模型产品负责人还指出,由于大模型开始做应用了,应用场景都是推理场景,对算力的需求量更大。

而另一家做垂直模型应用的技术主管也有同感。“现在对算力的需求正在从训练转向推理,映射到业务场景。”他预感到,模型大规模训练的频率和需求在降低或者放缓。

除了缺算力外,国内某互联网大厂机器人业务负责人发现,一些算力丰富的地方苦于找不到算力用户。他还指出,国内租用一张英伟达A100每月行情价在44000元左右,而租用多张卡并不是简单的数学计算,直言算力还是挺贵的。

对于上述情况,近日中国信通院云大所所长何宝宏把当前我国智算产业面临的挑战总结如下:算力孤岛问题显著,高端AI加速卡资源不足;GPU平均利用率常在30%以下;算力供需“断层”,算力空闲与算力短缺并存。此外,国产芯片虽然百花齐放,但生态仍不繁荣,适配需要资源支撑。

算力资源不均衡,是目前我国算力发展中的一大难题,算力调度是算力资源效率最大化的路径。多家分析机构称算力调度是未来算力网络的重要拼图,是算力时代的国家电网。

当前,中国算力调度市场处于早期阶段,市场格局较为分散,参与者众多。根据主导方不同,目前主要有四种类型的算力调度平台:政府主导、电信运营商主导、企业主导、行业机构主导,主要分布于和林格尔、贵阳、芜湖等国家算力枢纽节点,以及北京、上海、深圳等AI产业超一线城市,已布局不少单节点规模大于1000PFLOPS的大型算力中心,用于支撑通用基础大模型训练及高并发推理应用。

从全球视角来看,英伟达依旧是当前AI浪潮的版本答案,微软、谷歌、Meta等科技公司都在争相采购其高性能GPU芯片。其财报表现也显示着,算力的需求仍旧只增不减。

根据英伟达近期发布的第三季度(截至2024年10月27日)财报,英伟达该季度营收再创新高达351亿美元,同比增长94%;净利润为193.09亿美元,同比增长109%。

再看英伟达营收最大贡献者——数据中心业务(主要涵盖GPU芯片、AI服务器等软硬件产品),三季度该项收入录得308亿美元,同比增长112%,增速较上一季度的154%有所放缓。

英伟达执行副总裁兼首席财务官克雷斯·科莱特(Colette Kress)在电话会上指出,微软、亚马逊等大型云服务提供商占据了近一半的数据中心销售额,比重高于二季度的45%。

尽管投资者们开始质疑AI的投资回报率,但上述那些巨头客户仍在最新的财报电话会上强调将继续大幅投资AI基础设施,因此市场依然看好英伟达的业绩前景。英伟达预计,其第四季度营收将达375亿美元,上下浮动2%,不过增速将进一步放缓至69.5%。

(编辑:吴清 审核:李正豪 校对:颜京宁)