公司动态
经济观察网讯 2月24日,月之暗面Kimi发布了“Muon可扩展用于LLM训练”的新技术报告,并宣布推出“Moonlight”:一个在Muon上训练的30亿/160亿参数混合专家模型(MoE)。使用了5.7万亿个token,在更低的浮点运算次数(FLOPs)下实现了更好的性能,从而提升了帕累托效率边界。(编辑 万佳)
公司动态
经济观察网讯 2月24日,月之暗面Kimi发布了“Muon可扩展用于LLM训练”的新技术报告,并宣布推出“Moonlight”:一个在Muon上训练的30亿/160亿参数混合专家模型(MoE)。使用了5.7万亿个token,在更低的浮点运算次数(FLOPs)下实现了更好的性能,从而提升了帕累托效率边界。(编辑 万佳)
“IP for her”:揭秘知识产权如何点燃“她经济”
2025-03-08 12:45:24阅读(60)
对话诺奖得主约瑟夫·斯蒂格利茨丨人工智能信息生态与经济格局
2025-03-14 17:40:42阅读(57)
鞍钢走出来的四位现任副部级干部:一位副主任、一位副省长、两位央企董事长
2025-03-04 00:25:27阅读(56)
第九届CCER夏季研讨会征文启事
2025-03-11 21:17:21阅读(55)
EconoScope丨China's private economy ushers in greater opportunities for growth
2025-03-12 20:10:23阅读(54)