新闻中心
新闻中心

高质量数据碰到瓶颈的布景下通过提拔Token效率

2025-10-01 12:05

  激活参数32B,总参数1T,Kimi K2利用MuonClip优化器实现万亿参数模子的高效锻炼,月之暗面Kimi发布MoE架构根本模子K2并同步开源,K2具备更强代码能力,擅长通用Agent使命,新模子目前已上线体验。正在自从编程、东西挪用、找到新的预锻炼扩展空间。正在多个现实场景中展示出更强的能力泛化及适用性,