编辑邮箱:1527511756@qq.com
当前位置: 欧洲热线>> 科技>>正文内容

阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点

2024年07月09日 来源:中国网

在2024世界人工智能大会启明创投·创业与投资论坛上,阶跃星辰创始人、CEO姜大昕发表了演讲,分享了对于大模型发展现状与趋势的观察与思考。在演讲中,姜大昕重点阐述了一个核心观点:探索AGI路径,“Scaling Law”和“多模态”是相辅相成、缺一不可的两个方向。两者齐头并进,最终到达AGI。

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚未形成共识,但阶跃星辰认为,参数量接下来再提高一个数量级是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在随着参数量、数据量和计算量的增加呈幂次方增长。在此发展过程中,万亿参数量已经成为一个基本的入门门槛。

正是基于这样的认知,阶跃星辰很早便启动了万亿参数模型的训练。从千亿到万亿,模型的参数规模提升了一个量级,难度也提升了十倍以上。为此,阶跃星辰加大资源投入,尤其在系统和算法上积极探索,最终走通了万亿参数 MoE 大模型训练的道路。在 WAIC 2024 上,阶跃星辰发布了全新的 Step-2 万亿参数语言大模型正式版。根据从逻辑推理、世界知识、数学和编程等多个维度进行的权威测试,Step-2 模型能力都已全面接近国际主流模型,在部分测试集甚至实现了超越。

相关推荐
阶跃星辰姜大昕:Scaling Law仍处于陡峭区间,万亿参数是基本出发点

近年来,GPT系列模型的演进,客观上验证了Scaling Law的有效性。模型参数量决定模型能力的上限。从模型效果看,参数量增大确实带来了性能上的飞跃。虽然业内围绕“Scaling Law还能走多远”尚...[详细]

亮相2023年ICCAD,志翔数据安全方案助力行业创“芯”发展

11月10-11日,第29届中国集成电路设计业2023年会暨广州集成电路产业创新发展高峰论坛(ICCAD 2023)成功举办。本次大会深入探讨了当前形势下我国集成电路产业特别是IC设计业面临的困难与挑战及...[详细]

IDC发布中国数据智能市场生态图谱,志翔科技入选工业行业应用代表厂商

IDC指出,到 2027 年,70% 的经济价值将以高信息密度的商品和服务形式呈现,“数据有价值”的社会素养成型。其中数字化转型政策要求、AI 浪潮推动、更精细实时管理等需求将共同带动数据智能...[详细]

返回顶部