登入
關鍵字
#Gemma
官方認證
RexAA
昨天 16:03
•
記憶體最少只要1G!GoogleGemma 4全新量化版發佈,手機和輕薄本本地運行起飛
兩個月前,Google發佈了 Gemma 4 系列模型。此後,他們一直沒停:先是引入了多token預測(MTP)加速推理,兩天前補發了 12B 參數版本,填上 E4B 和 26B MoE 之間的空白。 今天,Google又推出了新的檢查點版本,核心技術是量化感知訓練(QAT),目標只有一個:讓 Gemma 4 能在手機、筆記本這類普通消費硬體上跑起來,質量幾乎持平量化之前 其中最關鍵的結果是:Gemma 4 E2B 的記憶體佔用被壓縮到了 1GB。 另外12B雖然可以在16G記憶體/視訊記憶體本上跑,但是速度太慢了,這次全新量化後12B-QAT,我在16G記憶體 M5 Macbook Air用LM Studio用了一下,果然比量化前的12B好用多了,token速度已經能接受了,建議上32G記憶體/視訊記憶體的本子,本地就有了真正可用的多模態模型了。
#記憶體
#Google
#Gemma 4
16人
讚
留言
分享
官方認證
RexAA
2026/06/04
•
重磅!Google開源Gemma 4 12B:統一的、無編碼器的多模態模型,16G記憶體筆記本就可以跑
剛剛,GoogleDeepMind發佈了Gemma 4 12B。 一句話概括這個模型的定位:把原本需要高端伺服器才能跑的多模態智能,裝進你的筆記型電腦裡。 它填補的是Gemma家族裡一個關鍵空缺:比邊緣端的E4B更強,比26B混合專家模型(MoE)更輕。而且在整個Gemma 4系列裡,它是第一個支援原生音訊輸入的中等規模模型。 到底有多能打?
#Google
#Gemma
#DeepMind
81人
讚
留言
分享
官方認證
RexAA
2026/06/04
•
Google Gemma 4 12B震撼發佈!全球下載破1.5億,16G輕薄本封神
【新智元導讀】剛剛,Google扔出Gemma 4 12B大殺器!16G輕薄本就能全離線流暢跑通,性能直逼26B巨獸,全體開發者驚呼太震撼了,平民級本地AI封神之作降臨。硬核實測速來看! 就在今天,全球AI開發者的朋友圈和X被同一個名字刷屏了——Google DeepMind Gemma 4 12B。 所有人還在為千億模型燒掉上千萬美元算力時,Google突然轉頭,向消費級硬體市場投下一枚神器! 這個模型,完全拋棄了傳統編碼器、原生支援文字、圖像和音訊直接輸入,能在16GB輕薄本上全離線運行,堪稱「多模態六邊形戰士」。
#Google
#Gemma
#AI模型
84人
讚
留言
分享
官方認證
RexAA
2025/03/13
•
炸裂🤯!Google推出單個GPU運行27B參數模型,性能超越DeepSeek V3和o3 mini
Google發佈Gemma 3,一個基於 Gemini 2.0 的全新開源模型 https://blog.google/technology/developers/gemma-3/ 給大家畫個重點 Gemma 3 設計目標是在各種裝置上快速運行,從手機、筆記型電腦到工作站,幫助開發者建立 AI 應用。 多種尺寸版本 (1B, 4B, 12B, 27B) 以適應不同的硬體和性能需求
#Google
#Gemma 3
234人
讚
留言
分享
官方認證
RexAA
2024/06/28
•
Google最強開源模型Gemma 2發布! 270億參數奇襲Llama 3,單張A100可全精度推理
可在單張A100/H100 GPU或TPU主機上高效運行全精度推理。 智東西6月28日報道,Google在I/O Connect大會上放大招,公佈其新一代最強開源模型-Gemma 2。 Gemma 2有90億(9B)和270億(27B)兩種參數規模可用。 27B模型訓練了13T tokens,9B是8T tokens,都擁有8192上下文窗口,可在Google AI Studio中使用。26億參數(2.6B)模型將很快發布,小到可以在手機本地運行。 在盲測大語言模型競技場LMSYS Chatbot Arena中,270億參數的Gemma 2指令微調模型擊敗了擁有700億參數的Llama 3,並超過Nemotron 4 340B、Claude 3 Sonnet、Command R+、Qwen 72B等模型,在所有開源權重的模型中排名第一;9B模型則是目前15B以下參數的模型中成績最好的。
#Google
#開源模型
#Gemma
191人
讚
留言
分享
官方認證
RexAA
2024/02/22
•
全球最強開源大模型一夜易主!GoogleGemma 7B碾壓Llama 2 13B,今夜重燃開源之戰
【導讀】 Google發表全球最強開源大模型Gemma,7B效能超越Llama 2 13B!Google和OpenAI,已經捲出了新高度。這一輪番放深夜炸彈的頻率,讓人不得不懷疑雙方都已經存了一堆大的。 一聲炸雷深夜炸響,Google居然也開源LLM了?! 這次,重磅開源的Gemma有2B和7B兩種規模,並且採用了與Gemini相同的研究和技術建構。 有了Gemini同源技術的加持,Gemma不僅在相同的規模下實現SOTA的性能。
#Google
#Gemma
#開源大模型
258人
讚
留言
分享