|
新聞詳情
2025年12月中國AI大模型平臺排行榜發表時間:2026-01-16 16:56
作者|參商 西梅汁 編輯|星奈 媒體|AI大模型工場
國內大模型發展趨勢|12月份解讀
C端流量爭奪戰與“超級APP”雛形顯現,AI原生應用迎來商業化爆發
國內 AI 大模型行業開始迎來C 端流量爭奪白熱化與商業化路徑清晰化的關鍵轉折點。各大巨頭不再滿足于 B 端賦能,紛紛大規模整合內部資源向 C 端全面發力。 這種變化背后,是“AI 原生超級 APP”雛形的快速顯現。阿里成立千問 C 端事業群,納入夸克、UC 等核心產品,依托統一 AI 底座打通多場景服務;其千問 App 公測僅 23 天月活便突破 3000 萬,增速超越 ChatGPT,成為全球增長最快的 AI 應用之一,印證了超級入口的打造潛力。 C 端流量爆發成為行業關鍵詞,用戶增長數據持續刷新紀錄。字節跳動豆包大模型日均 Token 使用量突破 50 萬億,海外 AI 助手 Dola 日活破千萬,實現國內外市場雙線領跑;商湯 Kapi 相機憑借 AI 拍照核心優勢,用戶量也快速增長,甚至一度登頂蘋果App Store中國區“攝影與錄像”類應用榜首;騰訊混元 2.0 發布三天調用量即達 1.2 億次,親民定價策略進一步加速市場滲透,流量爭奪進入白熱化階段。 更值得注意的是,C 端不再只是“燒錢換規?!?,而是開始顯現真實的商業化彈性。月之暗面完成 5 億美元 C 輪融資、估值 43 億美元的同時,Kimi 付費用戶月增速達到 170%,海外 API 收入增長 4 倍。相比早期“先做大 DAU、再談變現”的互聯網邏輯,大模型產品正在更早進入“用戶愿意為能力付費”的階段,這對行業信心的意義,甚至不亞于一輪大融資。 巨頭與創業公司的同步發力,一方面通過超級入口整合場景、爭奪用戶,另一方面以真實付費驗證產品力,推動行業從“燒錢敘事”轉向“盈利敘事”。相信一個更注重用戶體驗、商業健康與生態協同的AI原生時代正在加速到來。
2025年末大模型 “吸金” 超百億,商業化終于 “造血” 了? 12月,國內 AI 大模型行業資本動作密集爆發,融資與 IPO 雙線并進,成為年末行業焦點。月之暗面完成 5 億美元 C 輪超募,阿里、騰訊等老股東加碼,投后估值達 43 億美元;智譜沖刺港股 IPO,加上其他企業融資動態,賽道年末 “吸金” 超百億。 資本狂熱的核心支撐,是商業化 “造血” 能力的初步兌現。月之暗面 Kimi 付費用戶月增速 170%,海外 API 收入增長 4 倍,驗證了付費模式的可行性;智譜招股書披露,2022-2024 年營收年復合增長率 130%,本地化部署收入占比超八成,MaaS 模式形成規?;儸F。這些數據打破了 “大模型只燒錢不造血” 的質疑,讓資本看到技術到盈利的清晰閉環。 企業資本路徑呈現差異化特征。月之暗面選擇 “短期不上市”,靠技術突破與增長數據在一級市場募集巨額資金,聚焦下一代模型研發;智譜則通過 IPO 打通長期融資渠道,應對算力與研發的持續投入。同時,政策層面科創板、港交所相關通道的優化,為未盈利硬科技企業上市提供了便利,進一步助推了資本化進程。 2025年末的百億資本聚集,或將代表大模型行業已跨過技術爆發與市場啟蒙的初期階段,進入以商業化實績為導向、差異化競爭為特征的中場競逐。能否在資本助力下,真正構建起扎實的盈利模型與生態價值,將是下一階段行業分化的關鍵。大模型的“造血”故事,才剛剛寫下序章。
多家企業扎堆敲鐘!國產 AI 芯片迎來史上最密集 IPO 期 近期國產AI芯片行業正迎來前所未有的密集IPO期,多家領軍企業接連登陸資本市場。 摩爾線程與沐曦股份已于2025年12月成功登陸科創板,上市首日股價均出現大幅上漲。壁仞科技則成功在港交所上市,成為“港股國產GPU第一股”。緊隨其后,天數智芯也將于2026年1月8日在港交所掛牌。此外,燧原科技已完成科創板IPO輔導,百度旗下的昆侖芯也已啟動赴港IPO進程,顯示出市場極高的關注度與資本熱情。 這股上市熱潮的背后,是多重強勁驅動力的共振。首先,國內大模型應用的爆發式增長創造了爆炸性的算力需求。其次,在復雜的國際環境下,供應鏈安全與自主可控成為重中之重,為國產AI芯片提供了明確的替代空間和龐大的市場機會。最后,資本市場(尤其是科創板)為具備核心技術但尚未盈利的硬科技企業提供了上市通道,打通了研發投入與資本退出的關鍵循環。 當然,成功上市只是拿到了新階段的入場券,行業競爭的核心正在深化和轉移。競爭焦點正從單一的芯片算力參數比拼,轉向涵蓋芯片、系統、軟件的整體計算效能與性價比的較量。 市場或將更加分化,高端訓練芯片領域壁壘高筑,而推理側芯片則因更貼近實際應用場景,被視為國產芯片實現規?;涞睾筒町惢偁幍年P鍵賽道。對于所有企業而言,真正的“交付大考”才剛剛開始,實際的產品落地能力、穩定的客戶訂單與清晰的盈利路徑,將成為衡量企業價值的新標尺。
國內主要大模型進展 字節跳動 2025年末,字節跳動旗下海外AI助手Dola日活破千萬,火山引擎成為2026年春晚獨家AI云合作伙伴,同時豆包大模型1.8版本發布、Seedance 1.5 Pro音視頻創作模型推出,豆包手機助手技術預覽版及nubia M153工程樣機推出后引發商業生態討論。 12月31日,字節跳動旗下面向海外市場的AI助手應用Dola日活躍用戶數突破千萬,該產品主打對話問答、寫作翻譯與圖像能力,定位為“寫作、思考與創作的一站式助手”。數據顯示,10月以來Dola曾登上印尼、馬來西亞、墨西哥等國Google Play免費應用下載量前20名,在墨西哥市場曾連續一周蟬聯單日下載冠軍。Dola前身為2023年8月推出的Cici,2025年底完成更名。 12月28日,12月28日,中央廣播電視總臺《2026年春節聯歡晚會》分會場發布。活動現場宣布,火山引擎成為2026年春晚獨家AI云合作伙伴?;跇I界前沿的多模態大模型和云計算技術,火山引擎將深度參與到總臺春晚節目、線上互動和視頻直播中,以科技之力為這場全球華人的團圓盛宴添彩。 12月18日,火山引擎FORCE原動力大會召開,火山引擎總裁譚待披露關鍵數據:豆包大模型日均token使用量突破50萬億,較去年同期增長超10倍,截至12月已有超100家企業客戶累計token使用量超一萬億。會上同步發布豆包大模型1.8版本,在工具調用能力、復雜指令遵循和OS Agent能力上顯著增強,實現從“高效執行者”到“全能規劃師”的升級。此外,火山引擎推出AI安全新功能MaaS on AICC,支持火山方舟上的所有模型在AICC加密環境中運行,用戶可一鍵開啟機密推理服務。 12月16日,字節跳動Seed團隊正式發布新一代音視頻創作模型Seedance 1.5 Pro,支持音視頻聯合生成,涵蓋文本到音視頻合成、圖像引導音視頻生成等任務。 該模型實現三大核心突破:一是精準音畫同步,提升口型、語調與表演節奏擬合精度,原生支持多語種及四川話、粵語等特色方言;二是具備電影級運鏡控制能力,可執行長鏡頭跟隨、希區柯克變焦等復雜運鏡,呈現專業影調與畫面銜接;三是增強語義理解與敘事協調性,提升內容敘事感染力。目前該模型已上線即夢AI和豆包App,相關技術細節已通過Model Card公開。 12月1日,豆包手機助手正式推出技術預覽版,并與中興通訊聯合推出 nubia M153 工程樣機。該產品支持在用戶指令下跨應用調用服務,如點外賣、訂機票、比價購物、回復微信消息及操作小程序游戲等。問世不久后,微信、淘寶、大眾點評、拼多多等 App 相繼禁止在「豆包手機」上使用,引發對 AI 終端商業生態走向的討論。 阿里 12月31日,阿里通義千問團隊在魔搭社區和HuggingFace平臺開源Qwen-Image-2512新一代圖像生成模型。該模型在人物肌膚質感、自然紋理還原及復雜文字渲染方面實現大幅提升,生成圖片中人物發絲清晰可見,可流暢生成漫畫風格PPT、數據信息圖等復雜圖像,能充分滿足專業設計場景的多樣化需求,開發者和企業可免費下載商用。 12月31日,夸克AI眼鏡推送首發后的首次OTA重大更新,系統版本升級至1.2.1。此次更新全新上線錄音紀要、圖文備忘錄、大模型多意圖理解執行、藍環支付、社區服務五大核心功能,隨身翻譯語種從原有數量飆升至89種,同時優化了導航、音樂、行程查詢等高頻場景的交互體驗,進一步提升了產品的實用性與競爭力。 12月29日,阿里通義實驗室發布MAI-UI系列GUI智能體基座模型,該模型原生集成用戶交互、MCP工具調用、端云協同能力,通過自主進化數據管線和大規模在線強化學習,在5個權威評測集上登頂。其中MAI-UI-32B模型在AndroidWorld等真實任務基準中創造SOTA( state-of-the-art,當前最優)成績,2B與8B輕量化版本同步開源,將降低GUI智能體的開發門檻。 12月25日,阿里通義千問團隊開源Qwen-Image-Edit-2511圖像編輯模型,這是該系列模型繼2509版本后的重大迭代。新版本重點優化了“圖像漂移”問題,在人物一致性保持、工業設計、多模態控制等場景實現突破性升級,支持多人合照的精準融合,并通過內置LoRA模塊實現光照、材質、視角的精細化控制,適配更多專業設計需求。 12月24日,阿里對Qwen3-TTS語音模型家族進行重大升級,推出音色創造模型Qwen3-TTS-VD(VoiceDesign)和音色克隆模型Qwen3-TTS-VC(VoiceClone)。其中音色克隆模型僅需3秒音頻即可高保真復刻原聲,支持10種語言及方言,詞錯誤率(WER)比主流方案低15%,生成速度達實時2倍以上,進一步鞏固了阿里在語音合成領域的技術優勢。 12月23日,阿里在教育領域的重要布局,千問智學App正式上線,深度集成阿里自研的學習大模型,面向小學、初中、高中乃至研究生階段用戶提供免費的一對一學習輔導服務。App內置智能體“小千老師”,涵蓋知識點講解、習題答疑、作業批改等核心功能,所有服務完全免費,無強制訂閱或隱藏收費,旨在通過AI技術普惠優質教育資源。 12月22日,阿里正式發布Qwen-Image-Layered模型,該模型首次在AI領域實現PS級圖層編輯能力,通過自研架構將圖片精準拆解為獨立圖層,支持局部修改、對象替換、色彩調整等精細化操作,徹底解決了傳統AI生圖“牽一發而動全身”的行業痛點,被業內視為AI圖像編輯領域的里程碑式突破。 12月22日,千問官方發布“2025十大AI提示詞”榜單,基于平臺海量用戶交互數據,精準揭示了中國用戶使用大模型的真實高頻場景。榜單排名依次為:股票、八字、情感咨詢、職場、學習、健康、育兒、旅游、美食、人生意義,反映出AI已深度融入用戶的工作、生活與精神需求場景。 12月20日,阿里通義千問團隊在Hugging Face、Model Scope等平臺正式開源Qwen-Image-Layered模型。該模型具備突破性的圖像分層編輯能力,可將圖像分離為多個可獨立編輯的RGBA圖層,用戶可通過提示詞指定3到10個圖層數量,并對分解出的任意圖層進行無限遞歸分解。模型基于包含1000多款游戲、500萬張專業設計圖的海量數據集訓練,為圖像設計、創意創作等領域提供全新工具。 12月18日,千問App正式接入高德地圖核心服務,完成從純對話交互到場景化服務的關鍵升級,具備了物理世界的理解與行動能力。用戶可基于實時地理信息,通過千問生成包含餐廳推薦、酒店信息、路線規劃等內容的可視化決策卡片,并直接調用高德底層導航服務,實現“查詢-決策-執行”的全鏈路閉環。 此外,依托阿里AI空間智能感知技術,高德地圖上線“AI停車雷達”功能,可實現分鐘級車位預測。目前該功能已在北京率先覆蓋數萬個道路停車位,有效解決用戶“找車位難”的痛點,提升出行效率。 12月16日,阿里發布通義萬相2.6系列模型,涵蓋文生視頻、圖生視頻、圖像生成等五大核心能力,成為國內首個、全球第二個支持角色扮演功能的視頻生成工具(繼OpenAI Sora 2之后)。該模型支持音畫同步、多鏡頭生成、聲音驅動、分鏡控制等專業功能,單次可生成15秒影視級視頻,能將用戶簡單提示詞轉換為多分鏡腳本,保持多鏡頭間主體與場景的一致性,可滿足專業影視制作需求。模型同步上線阿里云百煉與萬相官網,向企業和開發者開放服務。 12月15日,阿里通義百聆正式發布并開源Fun-CosyVoice3-0.5B語音合成模型,核心突破在于零樣本音色克隆技術——僅需3秒參考音頻即可高保真復刻任意人聲。模型支持9種語言、18種方言及多情感表達,允許本地部署與二次開發,為播客制作、有聲書創作、智能客服等場景提供靈活的語音解決方案。 與Fun-CosyVoice3-0.5B同步,阿里開源輕量化語音識別模型Fun-ASR-Nano(0.8B參數)。該模型在噪聲場景下的識別準確率達行業領先水平,支持31種語言自由混說及歌詞說唱識別,可高效適配本地部署需求,進一步完善了通義百聆的語音技術生態。 12月11日,阿里發布Qwen3-TTS語音合成模型,具備49種音色自由切換能力,覆蓋10種語言及方言,詞錯誤率(WER)和擬人化程度均領先行業。模型支持零成本商用,特別適配播客、有聲書等場景,可精準還原不同角色聲線,為內容創作者提供高效的語音生成工具。 12月10日,千問App公測僅23天,月活用戶數(含APP、Web、PC端)便突破3000萬,成為全球增長最快的AI應用之一。同步推出AI PPT、AI寫作、AI文庫、AI講題四項新功能,進一步豐富辦公與學習場景的服務能力,持續強化“會聊天、能辦事”的產品定位。 12月9日,阿里巴巴宣布重大組織變革,正式成立千問C端事業群,由集團副總裁吳嘉出任負責人。此次調整整合了原智能信息事業群與智能互聯事業群,涵蓋千問APP、夸克瀏覽器、AI硬件、UC瀏覽器、書旗等核心產品,核心目標是將千問打造為AI時代的“超級APP”,接入購物、酒旅、辦公、出行等全生活場景,搶占AI時代用戶入口。這一戰略動作是阿里落實“用戶為先,AI驅動”雙輪驅動戰略的關鍵一步,標志著阿里將AI技術從產業端全面推向消費端。 12月2日,千問App正式接入通義萬相2.5模型,實現視頻生成能力重大升級。該模型為業界少數具備音畫同步能力的視頻模型之一,支持文本、圖像、視頻、音頻多模態輸入輸出,用戶僅憑一張照片和一段文字即可生成1080P高清唱跳視頻,最長支持10秒,且能精準匹配口型、保證肢體動作自然。此次升級后千問App公測一周下載量便突破1000萬次,超越ChatGPT、Sora等產品成為史上增長最快的AI應用,日活增速達行業平均5倍,迅速攀升至App Store工具類榜單Top 3。 整個12月,阿里在 AI 方向的節奏非常密集。成立千問 C 端事業群整合資源,千問月活破 3000 萬并接入高德拓展場景;密集發布多模態模型并開源,覆蓋圖像、文本等領域;落地電商、教育、辦公等多場景,將 AI 滲透率綁定 KPI,加碼算力基建,推進 AI 原生轉型。 釘釘 12月23日,釘釘在杭州舉辦AI釘釘1.1新品發布暨生態大會,發布AI釘釘1.1版本“木蘭”,推出全球首個為AI打造的工作智能操作系統——Agent OS,標志釘釘告別移動互聯網應用形態,轉型為AI操作系統,未來所有AI Agent均基于該系統搭建運行。 同步發布20余款AI新品,包括企業級AI硬件DingTalk Real、制造業“訂單Agent”“質量Agent”等商業可交付Agent,其中“訂單Agent”可一鍵將訂單圖片轉為排產表格,“質量Agent”能預測故障并推送智能檢修提醒,助力企業訂單處理時間縮短75%、錯誤率降低80%。此外,DingTalk A1硬件模型保持兩周一次迭代,已與客戶完成兩千余次共創,強化語音轉寫、語義分析等場景能力。 騰訊 12月30日,騰訊混元正式發布并開源翻譯模型1.5版本,包含1.8B和7B兩個尺寸。該系列模型支持33個語種互譯及5種民漢/方言,覆蓋主流語言與小語種,適配手機端離線實時翻譯。其中1.8B模型僅需1GB內存即可流暢運行,推理速度達0.18秒/50個tokens,通過On-Policy Distillation策略實現性能媲美超大閉源模型,還支持術語庫自定義、長文本理解等功能。目前模型已接入騰訊會議、企業微信等內部場景,開發者可通過GitHub、HuggingFace等平臺下載。 12月17日,騰訊AI實驗室發布計算機視覺領域重大突破——AdaptVision智能視覺系統。該系統首創分層視覺策略,先以低分辨率圖像掌握整體情況,再精準裁剪分析關鍵區域,同時通過解耦回合策略優化解決傳統訓練“功勞歸屬問題”。實測顯示,在保持相同準確率的前提下,平均僅使用傳統方法33%的視覺信息量,如識別摩托車號牌時可節省70%計算資源。 同時,騰訊混元世界模型1.5正式發布,成為國內首個開放實時體驗的世界模型產品,相關功能同步上線騰訊云開發者平臺,為開發者提供空間智能仿真相關能力支撐。 12月5日,騰訊正式發布自研大模型混元2.0,推出Think與Instruct雙版本。該模型采用混合專家架構,總參數406B、激活參數32B,在核心能力上實現重大突破:在2025年國際數學奧林匹克(IMO)公開題中準確率達83.1%超越GPT-4o,處理10萬字長文檔響應時間壓縮至12秒,代碼生成任務MultiPL-E測試得分59.2,支持12種編程語言全流程開發。 定價方面,以0.8元/百萬Token輸入、2元/百萬Token輸出的親民價格重新定義行業性價比,發布三天內調用量突破1.2億次,已有1.8萬家企業申請接入騰訊云API。目前模型已通過元寶APP、騰訊云API等多渠道開放,實現騰訊系產品全覆蓋,落地于金融、醫療、教育等多個領域。 百度 1月1日,百度旗下AI芯片子公司昆侖芯以保密形式向港交所提交主板上市申請,分拆后百度仍持股59.45%。高盛預測,若按40倍市銷率計算,百度持股價值或達220億美元,占其當前市值的45%。 12月31日,百度文心APP升級“放心寫”功能,聚焦公文與教育教學兩大中文寫作場景,基于權威數據源實現一鍵生成高質量公文,通過AI進行事實點提取、自動校驗與修正,文章準確率超99%,實現數據可溯源、事實可校驗,有效降低大模型幻覺。功能支持上傳文檔作為創作參考,借鑒內容會高亮展示,還可靈活編輯并一鍵導出為Word/PDF。 同日,百度宣布開源文心大模型4.5系列的10款模型,涵蓋47B、3B激活參數的混合專家(MoE)模型與0.3B參數的稠密型模型等,實現預訓練權重和推理代碼的完全開源。 12月25日,百度AI Day活動舉辦,公布超級智能體百度伐謀最新進展并發布“同舟生態伙伴計劃”。百度伐謀自11月發布以來已與超2000家企業場景共創,此次升級后進一步提升通用性、生產級與持續性;“同舟生態伙伴計劃”面向高校實驗室及行業軟件企業開放核心能力,提供高質量場景、課題及免費支持,加速AI產業落地?,F場展示了其在汽車研發風阻預測、氣體分離構型設計、防災減災預警等場景的應用成果。 12月23日,文心大模型5.0-Preview登榜LMArena大模型競技場最新文本榜,以1451分位列中國第一,超越Claude-Opus-4-1、GPT-5.2等多款國內外主流模型,在創意寫作、高難度指令等領域展現突出優勢。用戶登錄文心APP最新版本,可在側邊欄搶先體驗該版本。 12月16日,百度在秒噠2025創造者大會上公布無代碼應用搭建平臺“秒噠”最新進展,上線8個月累計生成超50萬個商業應用,日新增應用漲幅超150%,其中半數帶有后端,覆蓋教育、商業等200余個場景,累計創造經濟與效率價值超50億元?,F場同步發布“創造者筑夢計劃”,未來三年將通過流量扶持、交易分成等方式幫助100萬名創造者創收,2026年還將篩選15個高商用潛力項目開通快速通道,個人開發者項目有望獲得百萬元以上投資。 科大訊飛 1月5日,第三方機構智能超參數根據公開數據統計,2025年科大訊飛以210個中標項目、231568萬元披露金額,在通用大模型廠商中實現中標數量與中標金額雙第一,繼2024年后蟬聯大模型“標王”。科大訊飛中標項目主要分布在教育、醫療、金融、通信、能源、政務等行業,其中80%以上是應用類項目。 12月12日,科大訊飛發布訊飛星火X1.5深度推理大模型,整體性能達到GPT-5的95%以上,采用全棧自主可控技術架構,在華為昇騰芯片上完成訓練,將MoE模型訓練效率從30%提升至93%,實現全國產算力支撐。 科大訊飛智能體平臺Astron全面開源,該平臺將AI“大腦”與RPA“手腳”相結合,為開發者提供開箱即用的行業解決方案,進一步完善AI生態布局。 科大訊飛兩項AI應用案例成功入選行業典型案例:其一為AIUI人機交互平臺,融合多模態感知技術,鏈接20萬生態伙伴、22.5億終端設備,日均交互量超3億次,2025年融入大模型技術后新增超多輪對話、長時記憶等能力;其二為四川西充縣智能化應急管理體系,整合多源數據實現風險預警、違規識別與資源速調,破解縣域安全治理難題。 智譜 智譜(02513.HK)以116.2 港元 / 股發行價登陸港交所,成為全球大模型第一股。 上市首日開盤報 120 港元(漲幅 3.27%),盤中一度跌破發行價后午盤強勢拉升,最終收報 131.5 港元,漲幅 13.17%,市值達 578.9 億港元。上市后股價持續攀升,盤中最高漲超 60% 創上市新高,曾觸及 208.4 港元 / 股,市值一度超 1100 億港元;期間官宣與滴滴達成戰略合作,聚焦出行領域 AGI 應用,并中標中科院高能所 640.28 萬元科研項目,宣布新一代模型 GLM-5 即將面世。整體表現穩健上行,累計漲幅顯著,獲香港公開發售 1159.46 倍超額認購,國際發售 15.28 倍認購,市場關注度極高。 12月30日,智譜已正式啟動招股,認購期將持續至2026年1月5日,并計劃于2026年1月8日以股票代碼“2513”在港交所主板掛牌上市。按照招股書披露,智譜此次IPO擬發行37,419,500股H股,其中香港公開發售1,871,000股,國際發售35,548,500股。若按每股116.2港元的發行價計算,本次募資規模預計約43億港元,對應IPO市值有望超過511億港元(均不計“綠鞋”機制)。 12月28日,全球權威大模型評測榜單Artificial Analysis公布最新“AA智能指數”榜單,智譜GLM-4.7模型以68分綜合成績榮登開源模型榜首。該榜單重點考核模型知識儲備、邏輯推理、代碼生成及Agent等核心維度,被業界視為模型綜合實力的重要風向標,GLM-4.7此前已登頂開源社區Hugging Face全球趨勢榜第一。 12月23日,智譜發布GLM-4.7編程大模型,相較前代GLM-4.6,在編碼能力、交互體驗與復雜推理等維度實現系統性升級。該模型在AIME 25、人類最后考試(HLE)等基準中分數超GPT-5.1,SWE-Bench分數達73.8%(+5.8%)創開源新高;復雜推理、核心編碼、工具使用等能力顯著提升,支持“先思考、再行動”模式,官網Chatbot和API已同步上線。 12月10日,智譜發布并開源GLM-ASR系列語音識別模型,同時推出基于該系列模型打造的桌面端智譜AI輸入法,進一步拓展語音技術的應用場景與落地載體。 12月9日,智譜宣布開源核心AI Agent模型AutoGLM,這是全球首個具備“Phone Use”(手機操作)能力的AI Agent。該模型能穩定完成外賣點單、機票預訂等長達數十步的復雜操作流程,可“看懂”屏幕并模擬真人進行點擊、輸入、滑動等操作,已支持微信、淘寶、抖音、美團等超過50個高頻中文應用的核心場景。其開源將大幅降低AI手機技術門檻,推動AI手機生態從封閉走向開放共創,且支持本地與云端部署,保障數據與隱私控制權歸屬使用者。 12月8日,智譜上線并開源GLM-4.6V系列多模態大模型,進一步完善多模態技術生態,為開發者提供更豐富的多模態處理能力支撐。 MiniMax Minimax(0100.HK)以165 港元 / 股(招股區間上限)發行價登陸港交所。上市首日表現火爆,開盤后迅速沖高,盤中一度漲超 80%,最終收報 345 港元,漲幅達109.09%,市值突破 1000 億港元(約 1054 億港元)。次日股價繼續上漲 15.36%,市值達 1231 億港元;后續盤中漲近 40%,最高觸及 398 港元 / 股,上市后累計漲幅超 141%。公司悉數行使超額配股權,按發行價發行 437.96 萬股,額外募資凈額約 7 億港元,累計募資總額達 55.4 億港元。上市前獲香港公開發售 1837.17 倍超額認購,42 萬人參與認購,國際發售超額認購 36.76 倍,引入阿里、易方達等 14 家基石投資者,市場熱度空前。 12月29日,MiniMax M2.1模型全面上線AtomGit平臺,開發者可通過該平臺下載體驗。官方同步披露模型在Agent/工具腳手架泛化能力上的優勢,在多款編程工具與Agent框架中表現穩定,且支持多種Context Management機制,同時提供M2.1和M2.1-lightning兩個版本API。 12月26日,MiniMax正式開源MiniMax M2.1模型,開源權重可通過Hugging Face、GitHub等平臺下載,支持SGLang、vLLM等多種推理框架,并提供最優參數配置。該模型采用MoE架構,參數量229B、激活參數量10B,相比前代M2在編程相關場景核心榜單得分最高提升60%,多語言表現超過Claude Sonnet 4.5和Gemini 3 Pro。 此外,MiniMax與快看漫畫達成合作,作為核心技術合作伙伴為快看漫畫正式發布的AI陪伴互動漫畫提供視頻生成與語音生成模型支持,實現AI技術與漫畫世界觀、角色互動的深度結合。 12月22日,MiniMax正式發布全棧編程大模型MiniMax M2.1,該模型打破AI編碼“偏科”局限,實現后端、APP、3D開發全棧頂尖水平。在全新基準VIBE綜合榜單中以88.6分展現接近Claude Opus 4.5的全棧構建能力,在SWE-bench Multilingual榜單中以72.5分展現強勁競爭力。模型系統性提升了Rust、Java、Golang等多編程語言能力,顯著加強原生Android/iOS開發能力,支持復雜3D場景模擬與高質量可視化表達,思維鏈更精煉、響應速度提升且Token消耗下降,同時對主流編程工具做了專項優化。 商湯科技 12月20日,商湯Kapi相機用戶量突破千萬,成為千萬用戶首選攝影APP。該產品作為行業首個“AI拍照助手”,可復刻Apple Log曲線實現電影級質感直出,內置40余款復古濾鏡,1-2秒內智能識別場景并推薦最優濾鏡與構圖建議,此前已登頂菲律賓App Store免費應用總榜,并進軍英國、法國等歐洲多國榜單前五。 12月19日,商湯科技發布咔皮記賬APP全新升級版本,成為年輕人的"新一代AI財務助手",具備秒記賬、會省錢、懂規劃三大核心功能,依托日日新多模態大模型支持日常消費記賬等場景。 12月18日,商湯科技旗下大曉機器人發布三大核心技術突破:ACE具身研發范式、開悟世界模型3.0(首個面向商業應用的開源世界模型)、A1具身超級大腦模組,推動具身智能商業化落地。開悟3.0已與沐曦股份、壁仞科技、中科曙光等多款國產芯片完成適配。 同時,商湯科技、大曉機器人與中科曙光正式達成戰略合作,三方將打造具身智能領域的全棧國產化能力,構建"算力基礎設施+模型-具身融合"生態,搶占"多模態-具身"融合升級賽道。 12月17日,商湯發布如影營銷智能體,打造新一代電商AI增長引擎。該產品通過店鋪運營、直播運營、流量投放、直播場控四大電商Agent及數字人組成的“五大智能體矩陣”提升運營效率,其中直播數據復盤效率提升6倍,數字人可實現“當日復刻當日播”,助力電商場景智能化營銷升級。 12月16日,商湯科技正式發布AI辦公智能體「小浣熊3.0」,實現三大核心躍遷:從生成“草稿”到交付“成果”,可一鍵生成含大綱、版式、插圖與數據圖表的專業PPT,支持云端+本地多元素快速編輯;從響應“指令”到理解“任務”,具備長鏈條思考能力,支持百萬級數據秒級處理與多源關聯分析;從“單點”工具到融入“工作流”,支持跨平臺處理且移動端上線,企業級場景落地精度超95%。該產品依托日日新大模型在Agentic RL領域的突破,具備類人記憶與自主校驗糾錯能力,已服務1500萬+個人用戶與數千家企業用戶,并向浙江大學圖書館捐贈教育版。 12月15日,商湯日日新Seko系列模型與寒武紀成功適配,實現國產算力與多模態AI技術的關鍵跨越,為國產化AI生態的算力與模型協同優化提供支撐。同期,基于該系列模型的多劇集生成智能體Seko2.0亮相商湯產品發布周,具備創編一體、多劇集生成能力。 商湯科技“產品發布周”圓滿結束,多款AI產品獲得市場廣泛認可,包括Seko 2.0、小浣熊3.0、如影營銷智能體等,均基于日日新多模態大模型開發。 快手 12月3日,快手旗下可靈AI正式推出視頻生成2.6模型,核心升級“音畫同出”能力,改變傳統AI視頻“先無聲畫面、后人工配音”的創作流程。 該模型支持文生音畫、圖生音畫兩大功能,可單次生成包含自然語言、動作音效及環境氛圍音的完整視頻,在音畫協同、音頻質量和語義理解上表現亮眼,中文語音生成效果保持全球領先,目前支持中英文語音生成,生成視頻最長可達10秒。同時披露,可靈AI 2025年全年預計收入將達10億元人民幣,較年初目標提升超100%。 12月2日,快手可靈 AI 團隊宣布,全球首個統一多模態視頻模型 —— 可靈視頻 O1 模型全量上線。 據介紹,靈 O1 基于全新的視頻和圖像模型,以自然語言作為語義骨架,配合視頻、圖片、主體等多模態描述,將所有生成和編輯任務融合于一個全能引擎之中。 螞蟻集團 12月15日,螞蟻集團正式宣布將旗下AI健康應用AQ品牌升級為“螞蟻阿?!?,完成品牌與功能雙重煥新,標志著其在數字健康賽道的戰略重心從“醫療AI工具”向“AI健康朋友”系統性轉移。 新版App聚焦“健康+”戰略,核心升級“健康陪伴、健康問答、健康服務”三大功能板塊:可接入九大品牌智能設備數據、整合線下健康記錄并為家庭成員建立健康檔案;“AI診室”支持多模態交互,能通過圖片識別50類常見皮膚病、解讀99%常見檢查報告,準確率超95%;鏈接全國30萬真人醫生及6位院士領銜的500多位名醫“AI分身”,提供在線問診、掛號購藥等一體化服務。 據官方披露,該App月活用戶已突破1500萬,躋身國內AI應用前五,55%用戶來自三線及以下城市,日均處理健康提問超500萬個。 12月9日,全模態通用AI助手靈光正式推出網頁版,補全靈光多端生態。用戶可通過瀏覽器直接訪問,在電腦端體驗其核心的“靈光對話”和“ 靈光閃應用”功能。據悉,網頁版延續了“30秒用自然語言生成小應用”的核心優勢,實現了與移動端的數據與創作同步。用戶可在電腦上描述需求,快速生成、編輯并管理對話和閃應用,并在手機端繼續使用和分享。 12月2日,通用AI助手“靈光”宣布,靈光App上線兩周來,用戶已成功創建出330萬個“閃應用”,覆蓋互動游戲、情緒減壓、健身計劃等多類場景。數據顯示,靈光上線6天突破200萬下載,遠高于ChatGPT首周的60.6萬和Claude的15.7萬。 月之暗面 12月31日, 月之暗面創始人楊植麟發布內部信,宣布公司完成5億美元C輪融資且大幅超募,由IDG資本領投1.5億美元,阿里、騰訊、美團聯合創始人王慧文等老股東超額認購,投后估值達43億美元。 內部信透露,公司當前現金持有量超過100億元人民幣,短期不急于上市,計劃將資金用于擴增顯卡、內部研發K3模型以及大幅提升員工激勵。楊植麟定下2026年三項戰略:聚焦K3模型研發、加速商業化落地、提升員工激勵。 數據顯示,2025年9-11月,Kimi全球付費用戶數平均月度增速170%,K2 Thinking的發布推動海外API收入增長4倍,成為公司商業化高速增長的核心引擎。 12月28日月之暗面在Hugging Face上正式發布Kimi K2 Thinking模型的開源權重,采用修改后的MIT許可證,授予完整的商業和衍生權利。開發者、研究人員和公司均可自由使用、修改和分發該模型,進一步推動AI智能體技術的開放生態建設。 藍耘科技與月之暗面達成合作,通過藍耘的MaaS平臺部署Kimi K2模型,為開發者提供更高效、低成本的AI編程解決方案,實現本地化部署和免翻墻使用,效果接近Claude Code。 12月18日,微軟與月之暗面就Agent級技術合作展開深度洽談,計劃上線基于Kimi模型的智能體功能,推動Microsoft 365辦公套件向全面自動化邁進。此次合作聚焦Office產品的智能化改造,利用Kimi強大的長思考能力和工具調用能力提升辦公效率。 12月8日,月之暗面聯合創始人張予彤被正式任命為月之暗面Kimi總裁,全面負責公司戰略與商業化,包括融資、市場拓展等核心工作。這一人事調整標志著公司從技術驅動向技術與商業雙輪驅動轉型,加速推進Kimi模型的商業化落地。 DeepSeek
12月31日,DeepSeek團隊正式發布新論文《Manifold-Constrained Hyper-Connections》,提出一種能穩定訓練并提升大模型可擴展性的殘差連接新方案。 該論文由創始人梁文鋒參與撰寫,提出了名為“流形約束超連接”(mHC)的框架。作者稱,該框架旨在提升可擴展性,同時降低訓練先進人工智能系統的算力和能源需求。同時,DeepSeek下一代旗艦系統R2預計將在2月份春節前后問世。 12月1日,DeepSeek正式發布兩款核心大模型正式版:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。其中DeepSeek-V3.2強化Agent能力,平衡推理能力與輸出長度,適配日常問答及通用Agent任務場景,在公開推理類Benchmark測試中達到GPT-5水平,僅略低于Gemini-3.0-Pro,且輸出長度較Kimi-K2-Thinking大幅降低,顯著減少計算開銷與等待時間;DeepSeek-V3.2-Speciale為長思考增強版,融合DeepSeek-Math-V2的定理證明能力,具備出色的指令跟隨、嚴謹數學證明與邏輯驗證能力,主流推理基準性能媲美Gemini-3.0-Pro。
|