月之暗面重返基模戰(zhàn)場(chǎng)：發(fā)布首個(gè)開源萬億模型，押注“模型即Agent”

快訊 2025年07月13日 06:00 26 admin

　　炒股就看金麒麟分析師研報(bào)，權(quán)威，專業(yè)，及時(shí)，全面，助您挖掘潛力主題機(jī)會(huì)！

　　藍(lán)鯨新聞7月12日訊（記者朱俊熹）時(shí)隔半年，“大模型六小龍”之一的月之暗面終于推出新一代基座模型Kimi K2。據(jù)官方介紹，Kimi K2是一款具備更強(qiáng)代碼能力、更擅長(zhǎng)通用Agent任務(wù)的MoE架構(gòu)基礎(chǔ)模型，總參數(shù)達(dá)1萬億，激活參數(shù)為320億。

　　7月11日發(fā)布并同步開源的新模型包括兩個(gè)版本：基礎(chǔ)模型Kimi-K2-Base、更適合通用聊天和智能體任務(wù)的后訓(xùn)練模型Kimi-K2-Instruct。在自主編程、工具調(diào)用和數(shù)學(xué)推理相關(guān)的能力評(píng)測(cè)中，Kimi K2均取得了較優(yōu)的表現(xiàn)。以SWE-bench Verified、AIME 2025等評(píng)測(cè)集為例，Kimi-K2-Instruct的得分超過了同為開源模型的DeepSeek-V3、阿里Qwen3，逼近甚至能夠反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等領(lǐng)先閉源模型。

　　結(jié)合6月底開啟內(nèi)測(cè)的新Agent“Kimi-Researcher”不難看出，月之暗面的思路正轉(zhuǎn)向“模型即Agent”。模型自身就集成了自主決策和執(zhí)行任務(wù)的能力，能夠作為智能體解決復(fù)雜任務(wù)。

　　在官方釋出的用例中，用戶要求Kimi K2幫忙規(guī)劃參加Coldplay樂隊(duì)巡演的行程。該模型通過17次工具調(diào)用，涵蓋搜索、日歷、郵箱、航班、餐廳預(yù)訂等環(huán)節(jié)，制定出一份完整的機(jī)酒與旅游規(guī)劃，并形成可視化報(bào)告。

　　智能體能力正在成為國內(nèi)外大模型廠商競(jìng)相押注的進(jìn)化方向。本周，馬斯克旗下的人工智能初創(chuàng)公司xAI發(fā)布新一代大模型Grok 4，包括單智能體、多智能體兩個(gè)版本，具備工具使用、實(shí)時(shí)搜索等功能。Anthropic在推出Claude 4系列模型時(shí)也強(qiáng)調(diào)，在編程、推理和Agent方面“樹立了全新標(biāo)準(zhǔn)”，能夠處理復(fù)雜且長(zhǎng)時(shí)間運(yùn)行的任務(wù)。

　　月之暗面在Kimi K2的技術(shù)博客里分享了對(duì)構(gòu)建開放智能體智能的看法。其指出，預(yù)訓(xùn)練是智能體智能的關(guān)鍵基礎(chǔ)，它讓模型擁有基本的知識(shí)、理解和推理能力，從而在后續(xù)的強(qiáng)化學(xué)習(xí)中更有效地學(xué)習(xí)。但“人類數(shù)據(jù)就像是有限的‘化石燃料’”，因此如何在預(yù)訓(xùn)練階段提升對(duì)有限數(shù)據(jù)的利用效率，成為當(dāng)前AI擴(kuò)展的關(guān)鍵挑戰(zhàn)。

　　而在后訓(xùn)練階段，大模型不再只依賴人類數(shù)據(jù)，開始從自己的行為和結(jié)果中獲得獎(jiǎng)勵(lì)、進(jìn)行自我優(yōu)化，以實(shí)現(xiàn)超越人類能力的可能。

　　“Kimi K2正是在這些洞見之上鍛造而成的?！痹轮得姹硎?。其同時(shí)強(qiáng)調(diào)，Kimi K2是構(gòu)建通用Agent能力的堅(jiān)實(shí)基礎(chǔ)，但通用Agent還需要更高級(jí)的能力，比如思考和視覺理解，計(jì)劃未來為該模型加入這些能力。此外，長(zhǎng)文本處理能力曾是Kimi的核心優(yōu)勢(shì)，此次Kimi K2的上下文長(zhǎng)度為128k，不及部分新發(fā)布的模型。

　　值得注意的是，Kimi K2是國內(nèi)首個(gè)開源的萬億參數(shù)級(jí)別模型。此前雖有其他大模型廠商訓(xùn)練出萬億參數(shù)模型，如騰訊混元Turbo、MiniMax abab 6.5等，但都采取了閉源路線。

　　在訓(xùn)練Kimi K2這樣的萬億參數(shù)級(jí)別的大模型時(shí)，月之暗面采用了自主創(chuàng)新的Muon優(yōu)化器。與傳統(tǒng)的Adam優(yōu)化器相比，Muon在token利用效率上表現(xiàn)更優(yōu)，能讓大模型學(xué)得更快、更有效率。同時(shí)為解決Muon在超大規(guī)模訓(xùn)練時(shí)遇到的不穩(wěn)定問題，團(tuán)隊(duì)還提出了MuonClip這一穩(wěn)定性增強(qiáng)技術(shù)，支撐Kimi K2順利完成15.5萬億tokens的預(yù)訓(xùn)練，未出現(xiàn)訓(xùn)練損失值的異常峰值。

　　自年初DeepSeek橫空出世以來，月之暗面雖然陸續(xù)釋出了一些技術(shù)或產(chǎn)品上的更新，但始終未能重拾外界對(duì)其的熱切期待，一度表現(xiàn)得頗為低調(diào)沉寂。而此次Kimi K2的發(fā)布，讓這家明星創(chuàng)企終于重回基模舞臺(tái)的聚光燈下，這場(chǎng)牌局仍未見定論。

標(biāo)簽：模型萬億開源