算力、数据与算法,在本轮人工智能大模型产业兴起时被称为行业发展最重要的三大要素,随着ChatGPT带动的通用大模型热潮褪去与垂直赛道大模型的涌现,上述三大要素的细分需求亦随之发生变化。
在近日举办的2024云栖大会上,阿里云展示了全新升级后的AI Infra系列产品及能力,据其介绍,该模型中台连续训练有效时长大于99%,模型算力利用率提升20%以上。随着GPU供给渐趋稳定与架构方式的不断优化,算力降价亦成为各大云厂商的普遍趋势。
在训练数据供给方面,高质量、细分领域数据仍是稀缺资源,但围绕数据采集、清晰、交易的产业流程已渐趋完善,各行业对数据采集与利用重要性的认识亦不断加深。
而在各大厂商争相发布自身的通用大模型后,面向细分领域及场景需求的垂直类大模型,开始成为AI商业化落地过程中最重要的赛道——毕竟如若无法与市场需求对接,智能性再强的大模型也很难拥有支撑其长期迭代训练的土壤。
在本届大会上,丰富且多元的大模型应用似乎也在先在显示这样一种现实:此前被认为可能不及算力与数据重要的算法,成为大模型面向具体领域商业化的重要环节,且这种面向具体场景的算法竞争,也对算力和数据供给反向提出了新的要求。
成本降低
企业对大模型价格的书名可能存在差异,但定价无疑是最难以说谎的直观数据。从公开价格来看,无论是大模型调用的价格还是算力价格,在过去一年都开始呈现下降趋势。
以阿里云为例,百炼平台上的三款通义千问主力模型中,Qwen-Turbo价格直降85%,Qwen-Plus和Qwen-Max分别再降价80%和50%;阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在主论坛开幕式上表示,通义千问API在阿里云百炼上的调用价格下降了97%,百万tokens调用花费最低降到0.5元。
今年4月,SCNet国家超算互联网官网给出的英伟达A800人工智能训卡每小时训练价格降低到2元,且伴随着众多大模型开源,很多企业的训练需求也由整体的模型训练转为对成熟模型的二次训练调整,叠加GPU供给度过极度紧缺状态,算力价格得以有所下滑。
阿里云副总裁张启在大会发言中表示,目前新增的算力需求AI占比已经超过了50%,这意味着整个算力市场的主体需求正从原来的CPU转向AI计算,且这一趋势的加速度仍会不断提高。吴泳铭也不禁在大会发言中感慨,过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。
“现在我们也疯狂搞AI大基建,只有把资费降到足够低,才有可能去谈未来应用的爆发。”张启表示。
而在数据方面,无论是对通用大模型还是垂直类大模型,高质量、专业化的数据依然是各大厂商急需的训练资源,在本次云栖大会期间,与数据相关的产品和话题也受到广泛关注。
例如在产品方面,海天瑞声发布的DOTS一体化数据服务平台、51Sim展示的合成数据集及针对3D数据生产的工具链,均是围绕专业化数据采集、清洗提供的解决方案。
此外,对于大模型厂商而言,专业领域的数据积累,也成为其提升模型质量,构建自身竞争力的主要优势所在。
精准学CEO杨仁斌在接受南方财经全媒体记者采访时表示,就教育领域的大模型而言,核心的竞争壁垒在于数据积累,其基于自研语音端到端“心流大模型”开发的“超拟人AI一对一老师”,就是依托大量题库、学生行为反馈数据以及教育语音数据训练而成,充足且与应用场景高度相关的数据,能够显著提升AI生成内容的精确度及用户体验。
应用先行
多模态,是本届云栖大会的另一重点话题。
作为东道主,阿里云放出的一大重要发布内容便是通义万相的全面升级:搭载全新视频生成功能,可生成影视级高清视频,应用于影视创作、动画设计、广告设计等领域。
“图形和视频生成是当前付费意愿较强的领域之一,但是在商业化模式方面还没有形成统一的路径。”一位前来参会的宁波动画行业从业者在与记者交流时表示,除了C端订阅制收费外,B端的图像生成需求往往对细节、连贯性等方面存在较高要求,这往往是单次大模型调用难以一次完成的,且针对不同的主题,内容生成的质量和速度也各不相同,因此对商用需求的交付标准、训练次数等,业界和模型提供者还在磨合过程中。
而在自动驾驶领域,大模型的需求则相对明确。以本次带着“全球首款AI汽车”P7+亮相云栖大会的小鹏汽车为例,端到端自动驾驶、车载助力、通义灵码的代码编写是其提到的小鹏运用大模型的主要方向。
实际需求与大模型能力能否对接,本质上考验的是模型算法与应用场景的适配程度。值得注意的是,当ToB还在反复衡量商业模式与算力成本时,ToC应用则已经开始侧重于个性化与定制服务。
在以体验和博弈为主要乐趣的游戏行业,富有自由度和应变能力的交互方式,被视为AI对游戏带来的最大提升之一。例如巨人网络于本次云栖大会展示的“AI残局挑战”就专注于高智慧行为,能够根据不同局势采取谋略、伪装甚至互相“抱团”。据展台工作人员介绍,这种根据玩家对局情况进行调整的功能能够极大提升玩家的游玩乐趣。
在教育领域,杨仁斌则指出,一对一教学是最主要的需求之一,但不同学生的知识情况和学习习惯则各不相同,垂直类AI在升级后最重要的能力就是根据教学情况,及时切换教学方式,提升学习效果,增加教学资源供给。
“要以AI为中心构建一切服务。而不是原有的产品加上一个AI模块,这样充其量只能叫用AI降本增效,但无法从本质上解决问题。”他表示,这种能够根据学生实时提问、反馈决定生成内容个性化服务,就是其ToC最主要的竞争力和付费支撑。