Sign In

相關資訊

推理能力拍得住奧數金牌得主?國產 AI 豆包 2.0 震撼發布 性能對標 Gemini、ChatGPT!【附連結免費試玩】

推理能力拍得住奧數金牌得主?國產 AI 豆包 2.0 震撼發布 性能對標 Gemini、ChatGPT!【附連結免費試玩】


字節跳動近日持續震撼 AI 界!隨著 Seedance 2.0 於影片生成技術的進化,Seedream 5.0 對標 Nano Banana Pro 的性能,字節跳動於 14 日更推出豆包 2.0 ,宣佈邁向「AI 助理」時代。新版本在效能上全面對標 GPT-5.2 及 Gemini 3 Pro,更將推理成本降低約 90%,意圖以極高性價比在大規模商業化應用中突圍。

多模態能力躍升 從被動問答轉向主動指導

豆包 2.0 於多模態理解方面取得重大突破,特別是在長影片分析與動態場景感知上表現出色。其中於 EgoTempo、TVBench 等基準測試中,模型分數甚至超越人類平均水平,顯示其捕捉畫面節奏、動作變化及空間邏輯的能力更趨穩定。

而憑藉強大的實時影片分析能力,豆包 2.0 由被動回答問題的語言模型,進化為主動指導的智能助理,甚至適用於情感陪伴、健身指導、穿搭建議等場景,並能即時感知環境變化作出糾錯。

推理實力達金牌水準 科學領域表現強勁

豆包 2.0 Pro 更於核心推理測試以及代理能力中,展現出與國際頂尖模型並駕齊驅的實力,能夠於國際及中國數學奧林匹克、國際大學生程式設計競賽中均取得金牌成績。

而強化特定領域知識後,豆包 2.0 Pro 能夠在 SuperGPQA 分數上超越 GPT-5.2,於科學領域整體表現與 Gemini 3 Pro 及 GPT-5.2 相當,並在醫療評測 HealthBench 奪得第一名。

農曆新年 AI 爭奪戰 成本優勢成商業化關鍵

是次發布正值農曆新年長假期前夕,被視為字節跳動抵禦競爭對手、鞏固市場地位的重要舉措。據 QuestMobile 去年 12 月底的數據顯示,豆包目前以 1.55 億周活躍用戶位居中國 AI 應用之首,而第二名 DeepSeek 以 8160 萬名用戶正緊追其後。

業界分析指,豆包 2.0 將推理成本降低約十倍。因大規模推理與長鏈路生成會消耗大量 token,豆包 2.0 的成本優勢將大幅提升企業導入 AI 代理的意願,例如其在企業協作平台飛書上打造的智慧客服,已能調用不同技能與客戶對話,遇到複雜問題時能更能邀請真人協作。

目前,豆包 2.0 Pro 已於豆包 APP、電腦版以及網頁版上線,連結於下方資料來源處,只須登入後並於對話框選取「專家」模式即可使用;火山引擎亦同步提供豆包 2.0 供開發者使用;Code 版則整合至 AI 工具 TRAE。

即刻【按此】,用 App 睇更多產品開箱影片

【熱門報道】

Source:鉅亨豆包QuestMobile


繼影片生成模型 Seedance 2.0 引發熱議後,字節跳動再度發力,發布 Seedream 5.0 圖像生成模型。新版本目前已在「剪映」、海外版「CapCut」及 AI 創作平台「小雲雀」全面上線,並於「即夢AI」平台啟動小規模測試。該模型以「國產免費工具」定位,明確對標目前高階 AI 圖像工具 Nano Banana Pro。

Source:ezone.hk


小米正式發布並開源具身智能模型Xiaomi-Robotics-0,具備47億參數,成功於三大主流仿真測試奪得最先進水平。該模型採用自研混合架構,支援消費級顯卡實時推理,解決機器人動作延遲痛點,並實現在真機流暢摺毛巾及拆積木。小米現已公開相關源代碼及模型權重,並宣布在全球範圍招募頂尖人才。

Source:ezone.hk





Source link

根據你的喜好