大象新闻记者 李莉 张迪驰
11月28日,人工智能领域顶级学术会议NeurIPS 2025公布论文奖项,阿里巴巴通义千问团队的研究成果从全球2万多篇投稿中脱颖而出,荣获最佳论文奖,成为本届唯一获此殊荣的中国团队。
大象新闻记者注意到,该论文首次在行业内揭示了注意力门控机制对大模型性能与训练效果的影响机制。业内人士评价称,这项研究是突破当前大模型训练瓶颈的重要进展,将有力推动AI大模型技术发展。
据悉,NeurIPS作为人工智能领域最具影响力的会议之一,曾诞生Transformer、AlexNet等里程碑成果,今年共接收约25%的投稿,而最佳论文仅评选4篇,入选概率不足万分之二,代表了目前全球人工智能领域最有价值和影响力的研究。
通义千问团队表示:“对门控注意力机制的深入理解,不仅为大语言模型架构设计提供了新思路,也为构建更稳定、更高效、更可控的大模型奠定了基础。”
据悉,目前阿里千问已开源300多款模型,涵盖全模态、全尺寸,全球下载量突破7亿次,衍生模型超过18万个,位居全球第一。
赞一个