本地部署 Gemma4 E4B 实战指南：从旧模型迁移到统一多模态AI

wenjiuzzh • 12小时前 • OpenClaw教程

# 本地部署 Gemma4 E4B 实战指南：从旧模型迁移到统一多模态AI

## 迁移背景

2026年4月，我们将本地部署的多个小模型（gemma3:1b、qwen3.5:4b、moondream、Whisper）统一迁移到 Google 的 Gemma4 E4B（4B Effective），实现了单一模型处理图片识别、视频分析和语音识别任务。

## 环境要求

- **操作系统：** Ubuntu 22.04+ (ARM64 或 x86_64)
- **内存：** 推荐 16GB RAM（模型运行时占用约 10-11GB）
- **磁盘：** 10GB 可用空间（模型文件 9.6GB）
- **软件：** Ollama 0.20.0+

## 迁移步骤

### 1. 升级 Ollama 到 0.20+

```bash
# 检查当前版本
ollama --version

# 升级到最新版本
curl -fsSL https://ollama.com/install.sh | sh

# 重启服务
systemctl restart ollama # 或 service ollama restart
```

### 2. 卸载旧模型

```bash
ollama rm moondream:latest
ollama rm gemma3:1b
ollama rm qwen3.5:4b

# 卸载 Whisper（如果通过 pip 安装）
pip uninstall -y faster-whisper
```

### 3. 拉取 Gemma4 E4B

```bash
ollama pull gemma4:e4b
```

首次拉取需要下载 9.6GB 模型文件，耗时取决于网络速度。

### 4. 更新 OpenClaw 配置

编辑 `~/.openclaw/openclaw.json`：

```json
{
"agents": {
"defaults": {
"model": {
"primary": "openrouter/xiaomi/mimo-v2-pro",
"fallbacks": [
"ollama/gemma4:e4b" // ← 仅保留本地 Gemma4
]
},
"models": {
"ollama/gemma4:e4b": {
"alias": "local-gemma4"
}
// 移除旧模型配置
}
}
}
}
```

验证配置：
```bash
python3 -m json.tool ~/.openclaw/openclaw.json > /dev/null && echo "OK"
```

重启 Gateway：
```bash
openclaw gateway restart
```

## 性能测试

### 图片识别

使用以下命令测试：

```bash
curl -X POST http://127.0.0.1:11434/api/generate \
-H "Content-Type: application/json" \
-d '{
"model": "gemma4:e4b",
"prompt": "描述这张图片",
"images": [""],
"stream": false
}'
```

### 语音识别

Gemma4 支持音频输入（需转码为适当格式）：

```bash
# 将音频转为 base64
base64 -w0 audio.wav

# 发送识别请求
curl -X POST http://127.0.0.1:11434/api/generate \
-H "Content-Type: application/json" \
-d '{
"model": "gemma4:e4b",
"prompt": "转录这段音频",
"audio": "",
"stream": false
}'
```

## ARM64 优化建议

- 使用 Ollama 0.20+（已针对 ARM64 优化）
- 确保系统有足够交换空间（swap）避免 OOM
- 定期清理未使用的模型：`ollama ps` 查看运行中的，`ollama rm` 删除

## 多模态能力展示

| 任务类型 | 输入 | 输出 |
|---------|------|------|
| 图像描述 | JPEG/PNG 图片 | 详细场景描述 |
| OCR 文字识别 | 含文字的图片 | 提取的文字内容 |
| 视频关键帧分析 | 视频帧（base64） | 帧内容描述 |
| 语音转文字 | 音频文件（wav/mp3） | 转录文本 |

## 常见问题

**Q: 内存不足怎么办？**
A: 启用 swap（4-8GB），或升级服务器内存。

**Q: 推理速度慢？**
A: 首次推理需加载模型，后续会缓存加速。可调整 Ollama 的 `num_parallel` 参数。

**Q: 还想使用云端模型备份？**
A: 在 fallbacks 中保留多个云端模型，本地模型作为第一 fallback。

## 总结

通过迁移到 Gemma4 E4B，我们减少了模型复杂度（从4个模型合并为1个），降低了运维成本，同时提升了数据隐私保护水平。新模型在 ARM64 服务器上运行良好，多模态能力满足日常需求。

---

**分类：** OpenClaw 教程
**标签：** Gemma4, Ollama, 本地部署, 多模态, ARM64
**SEO描述：** 完整指南：将旧小模型迁移到 Gemma4 E4B，包括升级 Ollama、更新 OpenClaw 配置、性能测试与 ARM64 优化建议。

版权声明：
作者：wenjiuzzh
链接：https://blog.dingfengbo.eu.org/%e6%9c%ac%e5%9c%b0%e9%83%a8%e7%bd%b2-gemma4-e4b-%e5%ae%9e%e6%88%98%e6%8c%87%e5%8d%97%ef%bc%9a%e4%bb%8e%e6%97%a7%e6%a8%a1%e5%9e%8b%e8%bf%81%e7%a7%bb%e5%88%b0%e7%bb%9f%e4%b8%80%e5%a4%9a%e6%a8%a1/
来源：DINGFENGBO
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

Qwen3.6-Plus 深度评测：免费云端API vs 本地Gemma4 E4B

< <上一篇

本地部署 Gemma4 E4B 实战指南：从旧模型迁移到统一多模态AI

下一篇>>

DINGFENGBO

搜索内容

本地部署 Gemma4 E4B 实战指南：从旧模型迁移到统一多模态AI

取消回复

共有 0 条评论

热门文章