多款主力模型再降价 阿里云重仓AI大基建
2024-09-20 11:09      作者:李立     来源:中国经营网

本报记者 李立 杭州报道 

从持续推进大模型降价到全面升级AI基建,阿里巴巴正在重仓AI。

9月19日,在2024杭州云栖大会上,阿里云CTO周靖人宣布阿里云通义千问三款主力模型再次大幅降价,最高降幅85%。

针对国内大模型不断卷价格,持续掀起价格战的情况,周靖人在现场接受《中国经营报》等媒体记者采访时回应称“不认为是价格战”。“相对于庞大的应用,(价格)还是太贵了。”

关于降价初衷,周靖人称是把计算、技术的红利让利给企业级客户,希望推进整个社区、产业的发展。

当天在云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在主题演讲时也特别谈到,一年来,通义千问API在阿里云百炼上的调用价格下降了97%,百万Tokens调用花费最低已经降到了5毛钱。“推理成本是应用爆发的关键问题,阿里云会努力把成本继续降下去。”吴泳铭说。

降价经过深思熟虑

继5月首次大幅降价后,阿里云百炼平台上的三款通义千问主力模型再次降价,引发关注。

据现场公布的信息,Qwen-Turbo价格直降85%,低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,可应用于复杂任务,是效果、速度及成本均衡的优选,降价后,Qwen-Plus性价比优势明显,同等规模较行业价格低84%。同时,阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度。

“每一次降价都是一个非常严肃的过程。要从整个产业发展,开发者、企业用户的反馈等各方进行权衡。”周靖人称。

“降价主要通过技术优化。通过提升模型推理的效率,将模型推理成本进一步降下来。希望把技术红利给到企业级用户以及开发者。”周靖人解释称,需要有效推动整个AI行业的发展。只有这样,才能更有效推广各种各样AI的应用。

“使用量大,才能打磨出好模型,大幅降低模型推理的单位成本。”此前火山引擎总裁谭待曾表示,大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。业内人士认为,面对业内百模大战,卷价格仍是争夺客户和市场规模的有效利器。

据了解,自首次宣布降价后,阿里云百炼付费客户数较上一个季度增长超过200%,大批企业和开发者放弃私有化部署,选择直接在百炼上调用各类AI大模型。

谈到市场具体变化,此前通义千问大模型业务总经理徐栋接受记者采访时透露,越来越多的客户开始放量使用模型。“一类是大模型已经改变了其原有核心商业模式的客户,游戏、社交、短视频、直播、硬件厂商等,过去会纠结成本相对比较高、精度有没有满足等的问题;另一类是企业级客户,开始用公共云的方式去使用模型,垂直应用场景开始规模化应用。”

有关数据显示,截至目前,阿里云百炼已服务超30万个客户,包括一汽、金山、猎聘、哈啰、国家天文台等众多知名企业和机构。阿里云希望通过本次通义千问的第二轮降价,继续提升AI在各行各业的渗透率。

致力于打造最强AI基建

记者在现场注意到,大模型降价只是阿里云在AI时代竞速的一个侧面,阿里云更大的决心是全面升级AI基建。

不同于传统IT时代,AI时代对基础设施的性能、效率要求更高,CPU主导的计算体系已快速向GPU主导的AI计算体系转移。阿里云正以AI为中心,全面重构底层硬件、计算、存储、网络、数据库、大数据,并与AI场景有机适配、融合,加速模型的开发和应用,打造一个AI时代的最强AI基建。

大会现场,通义大模型迎来了年度重磅发布。据阿里云方面介绍,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万次,通义原生模型和衍生模型总数超过5万个,成为仅次于美国Llama的世界级模型群。

周靖人在现场还展示了AI驱动的阿里云全系列产品家族升级。包括最新上线的磐久AI服务器,支持单机16卡、显存1.5T,并提供AI算法预测GPU故障,准确率达92%;阿里云ACS首次推出GPU容器算力,通过拓扑感知调度,实现计算亲和度和性能的提升;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU,模型端到端训练性能提升10%以上等等。 

谈到基础设施的不断更新,周靖人表示,模型更新离不开基础设施,AI技术变革是系统化的技术变革,如果没有这个底层相关能力的支持,模型的研发、迭代等方方面面都没有承载,两者彼此是相辅相成、承上启下的关系。

值得注意的是,在当天的主题演讲中,吴泳铭透露,阿里云正以前所未有的强度投入AI技术研发和基础设施建设。“单网络集群已拓展至十万卡级别,正在从芯片、服务器、网络、存储到散热、供电、数据中心等方方面面,重新打造面向未来的AI先进基础设施。”

“我们总体判断,现在的AI相当于1996年前后的互联网,当年的BBS时代。当时上网资费还很贵,互联网、移动互联网发展,运营商大力搞基建。现在我们也在疯狂搞AI大基建,把资费降下来,才有可能谈未来应用爆发。”阿里云副总裁张启表示,“长远目标才是考虑更多的事情,而不是今天一定要算一个账,马上就能够赚多少钱、到什么样的目标。” 

(编辑:吴清 审核:李正豪 校对:颜京宁)