#Gemma | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#Gemma

LLM 推理機制被發現了？研究發現：所有大模型都會“坍縮”到低維空間

創新點 •基於內部動力學提出統一的標籤無關診斷指標，完全不依賴外部標註即可量化推理質量，為基準測試中心主義提供了互補框架。 •論證LLM推理從根本上受幾何結構和資訊約束支配，而非僅由任務性能驅動，為理解和診斷推理失敗提供了新的理論透鏡。方法

Google悄悄放了個大招，你的筆記本現在能跑頂級AI了

Google悄悄放了個大招，你的筆記本現在能跑頂級AI了故事是這樣的。 6月3號，Google DeepMind發了一個叫 Gemma 4 12B 的模型。沒有什麼盛大的發佈會，也沒有什麼刷屏的宣傳片，就是安安靜靜的丟了一個開源模型出來。但我覺得這可能是今年上半年對普通人影響最大的一個 AI 發佈。

實測Google Gemma4 12B：筆記本就能跑，是個全能 Agent！

最近，Google發佈Gemma4 12B模型，讓人眼前一亮！ 12B，中杯尺寸，但也能在16G記憶體本跑起來。而且，它是一個多模態全能Agent，支援理解圖片、音訊、視訊檔案。這兩天實測了下，感興趣的可以看看。

記憶體最少只要1G！GoogleGemma 4全新量化版發佈，手機和輕薄本本地運行起飛

兩個月前，Google發佈了 Gemma 4 系列模型。此後，他們一直沒停：先是引入了多token預測（MTP）加速推理，兩天前補發了 12B 參數版本，填上 E4B 和 26B MoE 之間的空白。今天，Google又推出了新的檢查點版本，核心技術是量化感知訓練（QAT），目標只有一個：讓 Gemma 4 能在手機、筆記本這類普通消費硬體上跑起來，質量幾乎持平量化之前其中最關鍵的結果是：Gemma 4 E2B 的記憶體佔用被壓縮到了 1GB。另外12B雖然可以在16G記憶體/視訊記憶體本上跑，但是速度太慢了，這次全新量化後12B-QAT，我在16G記憶體 M5 Macbook Air用LM Studio用了一下，果然比量化前的12B好用多了，token速度已經能接受了，建議上32G記憶體/視訊記憶體的本子，本地就有了真正可用的多模態模型了。

重磅！Google開源Gemma 4 12B：統一的、無編碼器的多模態模型，16G記憶體筆記本就可以跑

剛剛，GoogleDeepMind發佈了Gemma 4 12B。一句話概括這個模型的定位：把原本需要高端伺服器才能跑的多模態智能，裝進你的筆記型電腦裡。它填補的是Gemma家族裡一個關鍵空缺：比邊緣端的E4B更強，比26B混合專家模型（MoE）更輕。而且在整個Gemma 4系列裡，它是第一個支援原生音訊輸入的中等規模模型。到底有多能打？

Google Gemma 4 12B震撼發佈！全球下載破1.5億，16G輕薄本封神

【新智元導讀】剛剛，Google扔出Gemma 4 12B大殺器！16G輕薄本就能全離線流暢跑通，性能直逼26B巨獸，全體開發者驚呼太震撼了，平民級本地AI封神之作降臨。硬核實測速來看！就在今天，全球AI開發者的朋友圈和X被同一個名字刷屏了——Google DeepMind Gemma 4 12B。所有人還在為千億模型燒掉上千萬美元算力時，Google突然轉頭，向消費級硬體市場投下一枚神器！這個模型，完全拋棄了傳統編碼器、原生支援文字、圖像和音訊直接輸入，能在16GB輕薄本上全離線運行，堪稱「多模態六邊形戰士」。

炸裂🤯！Google推出單個GPU運行27B參數模型，性能超越DeepSeek V3和o3 mini

Google發佈Gemma 3，一個基於 Gemini 2.0 的全新開源模型 https://blog.google/technology/developers/gemma-3/ 給大家畫個重點 Gemma 3 設計目標是在各種裝置上快速運行，從手機、筆記型電腦到工作站，幫助開發者建立 AI 應用。多種尺寸版本 (1B, 4B, 12B, 27B) 以適應不同的硬體和性能需求

Google最強開源模型Gemma 2發布！ 270億參數奇襲Llama 3，單張A100可全精度推理

可在單張A100/H100 GPU或TPU主機上高效運行全精度推理。智東西6月28日報道，Google在I/O Connect大會上放大招，公佈其新一代最強開源模型－Gemma 2。 Gemma 2有90億（9B）和270億（27B）兩種參數規模可用。 27B模型訓練了13T tokens，9B是8T tokens，都擁有8192上下文窗口，可在Google AI Studio中使用。26億參數（2.6B）模型將很快發布，小到可以在手機本地運行。在盲測大語言模型競技場LMSYS Chatbot Arena中，270億參數的Gemma 2指令微調模型擊敗了擁有700億參數的Llama 3，並超過Nemotron 4 340B、Claude 3 Sonnet、Command R+、Qwen 72B等模型，在所有開源權重的模型中排名第一；9B模型則是目前15B以下參數的模型中成績最好的。