谷歌正式发布 Gemma 4 ：最强开源本地大模型，支持多模态+离线运行，附部署教程！

本文最后更新于93 天前，其中的信息可能已经过时，如有错误请发送邮件到meiyitou@gmail.com

就在昨天，谷歌正式发布了迄今为止最智能的开源大模型 —— Gemma 4。这次发布可以说在AI圈引发了不小的轰动，因为它主打两个关键词：

本地运行
多模态能力

一经上线，评价普遍非常高，甚至被认为是当前最值得关注的开源模型之一。

一、Gemma 4 有哪些版本？

这次谷歌一共推出了 4个不同规模的模型版本，覆盖从手机到高端GPU的全场景使用。

轻量级（移动端 / IoT）

2B（20亿参数）
4B（40亿参数）

特点：

更低延迟
强调多模态能力
可运行在手机甚至物联网设备上

高性能（本地GPU）

26B（专家混合模型）
31B（稠密模型）

特点：

支持复杂推理
可用于编程助手、Agent系统
完全支持离线运行

二、性能到底有多强？

谷歌表示：
Gemma 4 在“单位参数智能水平”上达到了前所未有的高度。

在 Arena-Hard 排行榜中：

31B → 排名第3
26B → 排名第6

甚至超过了一些规模大20倍的模型。

这意味着：
效率 > 参数量，真正实现“小模型干大事”

三、核心能力一览

Gemma 4 不只是一个文本模型，它已经是一个完整的 AI 系统能力集合：

多模态能力

图像识别（OCR）
视频理解
音频输入（小模型支持）

编程能力

离线代码生成
Web开发支持
自动生成 Docker 配置

Agent能力

自动任务执行
工具调用
工作流自动化

多语言支持

支持 140+ 语言

隐私 & 本地化

完全离线运行
数据不上传云端
更适合企业/个人隐私场景
可以轻松对接 OpenClaw 小龙虾进行使用

四、开源协议（重点）

Gemma 4 使用的是：

Apache 2.0 协议

意味着：

免费商用
可修改
可二次开发
可私有部署

这一点对开发者来说非常重要

五、本地部署配置要求

根据官方说明，不同版本对显存要求如下：

模型	显存需求
量化版（Q4）	最低约 3GB
26B	~18GB
31B	~20GB
31B BF16 满血版	~63GB

举个例子：

RTX 4090（24GB）
可以运行 26B / 31B 量化版

六、如何本地安装（Ollama方式）

推荐使用：Ollama

第一步：下载 Ollama

【点击前往】

进入官网下载安装（支持）：

Windows
Mac
Linux

第二步：下载 Gemma 4 模型

【HuggingFace】、【Ollama】或 下载满血版【模型打包下载】

安装 Ollama 后在CMD终端下执行：

ollama run gemma4

或者选择适合你显卡的版本（非常重要

）

第三步：对接OpenClaw

在Powershell下以管理员身份运行：

powershell -c “irm https://openclaw.ai/install.ps1 | iex”

安装最新版的小龙虾

安装后在执行命令：

ollama launch openclaw

即可启动！

第四步：对接Claude Code

1、Windows CMD:

curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmd

2、macOS, Linux, WSL:

curl -fsSL https://claude.ai/install.sh | bash

安装后再执行

ollama launch claude

七、实测效果展示

根据实际测试，Gemma 4 表现非常亮眼：

1. 逻辑推理能力

输入问题：

为什么端口映射后外网无法访问？

模型可以：

自动分析网络结构
找出逻辑矛盾
给出排查步骤

推理能力非常稳定

2. 图像 + 编程能力

上传一张架构图，它可以：

自动识别系统结构
生成完整 Docker 部署方案

真正做到：看图写代码

3. AI生成游戏

仅通过一张截图：

自动生成一个可运行的小游戏

测试结果：

游戏可运行
有完整逻辑
体验流畅

4. Agent自动化能力

结合工具后可以实现：

自动抓取新闻
自动翻译
自动生成博客（Markdown）

已接近自动内容生产系统

八、使用建议（非常重要）

根据你的显卡来选模型：

8GB 显存
选择小模型
12GB
中等量化版
24GB
推荐 26B 或 31B

不要盲目上最大模型，否则会：

卡顿严重
推理速度慢

九、总结

这次 Gemma 4 的发布，可以说是：

开源AI的一次重大突破

它带来的核心变化是：

更强推理
真正多模态
完全本地运行
原生支持Agent

一句话总结

如果你想要一个能本地运行、性能强、还能做自动化工作的AI模型，Gemma 4 是目前最值得尝试的选择之一。