首頁 > 新聞 > 緊湊型AI的推理能力:挑戰GPT?

緊湊型AI的推理能力:挑戰GPT?

Apr 09,25(7 前個月)

近年來,大型語言模型(LLMS)的成功吸引了AI領域。這些模型最初是為自然語言處理而設計的,已演變為強大的推理工具,能夠通過類似人類的逐步思考過程來解決複雜問題。但是,儘管具有出色的推理能力,但LLMS仍具有重要的缺點,包括高計算成本和緩慢的部署速度,這使得它們對於在資源受限的環境(例如移動設備或邊緣計算)中的現實使用中不切實際。這導致人們對開發較小,更高效的模型的興趣日益增加,這些模型可以提供類似的推理能力,同時最大程度地減少成本和資源需求。本文探討了這些小推理模型的興起,它們對AI的未來的潛力,挑戰和影響。

觀點的轉變

對於AI最近的大部分歷史,該領域都遵循“縮放定律”的原則,這表明模型性能可以隨著數據,計算功率和模型大小的增加而預測。儘管這種方法產生了強大的模型,但它也導致了重大的權衡,包括高基礎設施成本,環境影響和潛伏期問題。並非所有應用都需要具有數百十億個參數的大型模型的全部功能。在許多實際情況下,例如在設備助手,醫療保健和教育等案件中,如果有效的理由,他們的模型可以取得相似的結果。

了解AI中的推理

AI中的推理是指模型遵循邏輯鏈,理解因果關係,推論含義,計劃步驟中的含義並確定矛盾的能力。對於語言模型,這通常意味著不僅要檢索信息,還意味著通過結構化的逐步方法來操縱和推斷信息。通常,通過微調LLMS來實現這種推理水平,以在獲得答案之前執行多步理學。儘管有效,這些方法需要大量的計算資源,並且部署可能會緩慢且昂貴,這引起了人們對其可及性和環境影響的擔憂。

了解小推理模型

小推理模型旨在復制大型模型的推理能力,但在計算能力,內存使用和延遲方面具有更高的效率。這些模型通常採用一種稱為知識蒸餾的技術,其中較小的模型(“學生”)從較大的預訓練模型(“老師”)中學習。蒸餾過程涉及對較大數據生成的數據訓練較小的模型,以傳遞推理能力。然後,對學生模型進行微調以提高其性能。在某些情況下,採用特定領域特定獎勵功能的增強學習來進一步增強模型執行特定於任務推理的能力。

小推理模型的興起和進步

小型推理模型發展中的一個顯著里程碑是DeepSeek-R1的發布。儘管接受了相對適量的較舊GPU的培訓,但DeepSeek-R1還是在MMLU和GSM-8K等基准上的OpenAi O1(例如OpenAI的O1)競爭的性能。這一成就導致了對傳統縮放方法的重新考慮,該方法假設較大的模型本質上是優越的。

DeepSeek-R1的成功可以歸因於其創新的培訓過程,該過程將大規模的強化學習結合在一起而不依賴於早期階段的監督微調。與大型推理模型相比,這一創新導致了DeepSeek-R1-Zero的創建,該模型具有令人印象深刻的推理能力。進一步的改進,例如使用冷啟動數據,增強了模型的連貫性和任務執行,尤其是在數學和代碼等領域。

此外,事實證明,蒸餾技術對於從較大的模型開發較小,更有效的模型至關重要。例如,DeepSeek發布了其模型的蒸餾版本,尺寸從15億到700億個參數不等。使用這些模型,研究人員培訓了一個較小的模型DeepSeek-R1-Distill-Qwen-32b,該模型的表現優於OpenAI的O1-Mini,跨越了各種基準。這些模型現在可以使用標準硬件部署,使其成為廣泛應用程序的更可行的選擇。

小型型號可以匹配GPT級別的推理嗎?

為了評估小型推理模型(SRMS)是否可以與GPT這樣的大型模型(LRM)的推理能力匹配,評估其在標準基準測試上的性能很重要。例如,在MMLU測試中,DeepSeek-R1模型在0.844左右得分,可與大型模型(例如O1)相媲美。 DeepSeek-R1的蒸餾型在GSM-8K數據集(GSM-8K數據集)上,達到了頂級性能,超過了O1和O1 Mini。

在編碼任務(例如LiveCodeBench和CodeForces上的任務)中,DeepSeek-R1的蒸餾模型的執行方式類似於O1-Mini和GPT-4O,在編程中表明了強大的推理能力。但是,較大的模型在需要更廣泛的語言理解或處理長上下文窗口的任務中仍然具有優勢,因為較小的模型往往更特定於任務。

儘管有優勢,但小型模型仍可能在擴展的推理任務或面對分發數據時掙扎。例如,在LLM國際象棋模擬中,DeepSeek-R1比大型模型犯了更多的錯誤,這表明其長期保持專注和準確性的能力限制。

權衡和實踐意義

將SRM與GPT級LRMS進行比較時,模型大小和性能之間的權衡至關重要。較小的模型需要更少的內存和計算能力,使其非常適合邊緣設備,移動應用程序或需要離線推理的情況。這種效率會導致運營成本較低,而諸如DeepSeek-R1之類的型號比O1等大型型號便宜96%。

但是,這些效率提高帶來了一些妥協。較小的模型通常用於特定任務,與較大的型號相比,這可能會限制其多功能性。例如,儘管DeepSeek-R1在數學和編碼方面表現出色,但它缺乏多模式功能,例如解釋圖像的能力,例如GPT-4O(例如GPT-4O)可以處理的圖像。

儘管存在這些局限性,但小推理模型的實際應用還是廣泛的。在醫療保健方面,它們可以為分析標準醫院服務器的醫療數據提供動力。在教育方面,它們可用於開發個性化的輔導系統,向學生提供逐步的反饋。在科學研究中,他們可以在數學和物理等領域進行數據分析和假設檢驗。諸如DeepSeek-R1之類的模型的開源性質也促進了協作並使對AI的訪問權限,使較小的組織能夠從先進的技術中受益。

底線

語言模型轉化為較小的推理模型是AI的重大進步。儘管這些模型可能尚未完全匹配大語言模型的廣泛功能,但它們在效率,成本效益和可訪問性方面具有關鍵優勢。通過在推理能力和資源效率之間達到平衡,較小的模型將在各種應用程序中發揮關鍵作用,從而使AI更實用和可持續性。

發現更多
  • Mahjong 3D
    Mahjong 3D
    用3D麻將牌與引人入勝的遊戲玩法挑戰自我!如果你喜歡麻將、骨牌、數獨或任何具挑戰性的益智遊戲,你來對地方了!立體麻將:配對拼圖與免費方塊益智遊戲巧妙融合經典麻將與配對遊戲。其精心設計的挑戰關卡將帶給你真正的遊戲樂趣。遊戲方式◈ 輕點即可將3D麻將牌放入方塊中。配對兩張相同牌組即可將其消除。目標是盡可能快速清除所有牌組。◈ 成功收集所有牌組即可獲勝!◈ 若場上留存三組未配對牌組則挑戰失敗!◈ 每個關卡皆設有時限。請在時間耗盡前完成遊戲。遊戲特色:◈ 無限遊玩模式◈ 規則簡單卻令人上癮的玩法,適合全
  • Clash Of Pets
    Clash Of Pets
    體驗刺激的三消戰鬥與受到塔麻可吉啟發的寵物養育樂趣!遊玩即可獲得精彩獎勵投身《寵物衝突》——創新的三消冒險遊戲,透過獨特的免費賺取系統收集免費加密貨幣,同時與迷人的虛擬夥伴建立羈絆。這款突破性作品融合解謎策略與寵物模擬,讓您透過遊戲贏取比特幣、柴犬幣、狗狗幣、萊特幣和Matic幣。在這場策略解謎體驗中,掌握魔法助推器與無數組合來爭取高分。於腎上腺素飆升的PvP三消錦標賽中,與全球玩家和挑戰者進行對決,挑戰包含多元目標的賽事。偏好單人遊玩?PvE模式提供無限解謎關卡,伴隨逐步升級的挑戰目標與障礙—
  • Aztec Gold II
    Aztec Gold II
    熱門老虎機遊戲《阿茲特克黃金》限量版一款色彩繽紛的老虎機將為玩家述說阿茲特克黃金的故事,其中包括雄偉的金字塔與無人能解的祕密。這款遊戲採用標準的5卷軸21線結構。玩家亦可選擇僅啟用單一線路或全部21條線路。主要功能:當轉盤上出現三個金字塔符號時,將觸發獎勵遊戲;玩家需在僅有三次機會的情況下猜中正確的金字塔。版本1.3.4更新內容最近更新於2024年10月18日 基礎性能提升 輕微錯誤修正 系統整體優化
  • Color by Number ®: No.Draw
    Color by Number ®: No.Draw
    數字沙盒 - 一款輕鬆的數字填色像素藝術遊戲數字填色為全年齡層提供最優質的免費數位填色體驗。探索無數等待您創意觸碰的像素藝術傑作,每日新增設計 - 您的填色冒險永不停歇!簡單有趣的遊戲玩法每個標有數字的像素都指引著您的填色旅程。只需將顏色與數字配對,即可觀賞令人驚嘆的像素藝術躍然眼前!除了極具娛樂性之外,我們的填色應用程式更有助於培養藝術能力,同時提供完美的壓力緩解。讓自己沉浸於舒緩的色彩療癒時光中!這款遊戲完美適合各年齡層的藝術愛好者,數字填色為您帶來無盡的創作滿足感。立即免費安裝,釋放您內心
  • Slots - Lotto Jackpot
    Slots - Lotto Jackpot
    你是否正在尋找一款令人振奮、節奏緊湊的遊戲,既能挑戰運氣又能贏得豐厚獎勵?快來體驗《Slots - Lotto Jackpot》!這款獨一無二的應用程式將虛擬3D彩票的刺激感與吃角子老虎機的動感體驗完美融合。你可以選擇隨機抽取數字或使用自己的幸運號碼來追逐頭獎。這款遊戲專為渴望持續興奮的成年玩家設計,非常適合快速娛樂休閒。由於所有點數僅限於應用程式內使用且不具現金價值,你可以盡情享受贏獎的樂趣,無需承擔任何財務風險。立即下載《Slots - Lotto Jackpot》,轉出屬於你的巨額獎勵!
  • Lost Temple Castle Frozen Run Mod
    Lost Temple Castle Frozen Run Mod
    暢玩《失落的寺廟城堡:冰封逃亡》Mod版,體驗這款令人驚心動魄的沉浸式冒險遊戲!引領一位勇敢的公主,在陰森叢林中逃離緊追不捨的怪物。置身於寒風刺骨的冰雪世界,這位寺廟公主需要倚靠你的技巧躲避可怕的巨龍。本作已在 Android 商店上架,這款無盡跑酷遊戲將讓你沉醉於追逐高分之中。跳躍、轉彎、閃避障礙,全力保持領先。在穿越迷人而神秘的地圖時收集獎勵。立即下載,體驗 2020 年最精彩的寺廟無盡逃亡! 《失落的寺廟城堡:冰封逃亡》Mod版的主要特色: * 城堡主題的無盡冰封衝刺:在這場不間斷的