主页 > 全部资讯 > 财经新闻 > 张予彤清华分享 月之暗面Kimi K2模型表现亮眼

张予彤清华分享 月之暗面Kimi K2模型表现亮眼

2025-12-09 财经大神

“没有一百万张显卡,你根本做不了大模型。”这曾是AI行业的共识。然而,月之暗面(Kimi)总裁张予彤认为,当算力资源不再是唯一考量时,事情正在发生变化。

近日,张予彤在清华大学进行了公开分享,这是她自2024年底卷入与金沙江创投主管合伙人朱啸虎的“股权隐瞒”风波后罕见的一次露面。去年底,朱啸虎指责张予彤在职期间隐瞒股份,但月之暗面创始人杨植麟发文力挺,强调股份授予基于其长期贡献。风波未影响张予彤的步伐。作为公司战略与商业化的负责人,她在分享中不仅披露了最新上线的Kimi K2 Thinking的技术细节,还阐述了公司的业务走向和商业化思考。

张予彤表示,行业最初质疑月之暗面缺乏足够的算力资源。但随着对算力资源重要性的重新认识,他们发现真正的瓶颈在于数据处理能力。月之暗面通过二阶优化器Muon的大规模应用,实现了至少两倍的token效率提升,降低了训练成本。此外,他们推行“Day-0 Co-Design”理念,让基础设施与算法深度耦合,进一步提升了智能效率。今年11月上线的Kimi K2 Thinking模型,在多项基准测试中表现优异,获得非思考模型最佳成绩。目前,Cursor、Youware等全球知名AI应用已接入该模型。

张予彤特别提到,Kimi模型在AI搜索中的深度研究方面表现出色。K2 Thinking支持多达200-300轮工具调用,可以边思考边使用工具完成复杂调研任务。Vercel创始人在社交媒体透露,Kimi实际表现优于其他闭源模型。投资机构Social Capital的CEO也表示,旗下公司已将大量工作转至K2平台,因为性能强且成本低。从产品层面,月之暗面践行“模型即产品”理念,将模型与Agent产品体验垂直整合。今年推出的“OK Computer”Agent模式,支持包括图片生成在内的20多种工具,未来将升级至200-300步。用户对OK Computer进行了极限测试,展示了其处理长时任务的能力。

在底层效率问题被创新攻克后,如何将技术突破转化为商业壁垒成为新的考量。张予彤表示,最有效的竞争方式是找到自己的优势领域。月之暗面的核心优势在于底层技术创新和端到端的联合优化能力。团队只有300人,能够快速响应新想法。从产品定位看,Kimi专注于逻辑层、Agent层以及生产力任务。张予彤认为,大模型与AI应用的关系是一个动态演进过程,需要具备前瞻性设计能力,以适应快速变化的技术。

主流币行情

相关阅读