GLM-4-Voice实时语音对话机器人（暂时放弃）-龍騰博客

📂 第一步：在 fNOS 里建好用来装模型的“小仓库”

就像买书之前要先在家里搭好书架一样，我们先去你的 fNOS 系统里把文件夹建好。

在电脑上打开浏览器，登录你的 fNOS 管理后台。
在桌面上找到并打开 “文件管理器”（类似于你 Windows 电脑的“此电脑”）。
找到你的主存储空间（通常叫 Volume1 或者是 存储空间1），在里面双击进入 Docker 文件夹。
在 Docker 文件夹的空白处点击鼠标右键，选择 “新建文件夹”，命名为：glm4-voice。
双击进入这个刚刚建好的 glm4-voice 文件夹，在里面再次右键，选择 “新建文件夹”，命名为：models。

🛠️ 此时你的路径结构是： Docker $\rightarrow$ glm4-voice $\rightarrow$ models。
保持这个网页开着，我们去下载模型。

📥 第二步：在你的书桌电脑上下载模型（新手最稳妥的两种方法）

国内下载大模型最权威的网站叫 ModelScope（魔搭社区）（这是阿里办的，国内下载速度极快，不需要翻墙）。我们要在魔搭上把智普的 GLM-4-Voice-9B-GPTQ-Int4 模型搬回家。

我为你提供两种下载方式，你选一种最适合你的：

💻 方法 A：直接网页点击下载（最符合直觉，像下载电影一样）

在你的书桌电脑上，用浏览器打开魔搭社区的模型链接：
🔗 https://modelscope.cn/models/ZhipuAI/glm-4-voice-9b-gptq-int4/files
进去之后，你会看到一个文件列表，里面包含一堆 .safetensors、.json 后缀的文件。
点击全选 或者是 逐个点击每个文件后面的“下载”图标，把列表里的所有文件都下载到你当前这台电脑的 下载 (Downloads) 文件夹里。
下载完成后，在你的电脑上新建一个文件夹，命名为 glm-4-voice-9b-int4，把刚刚下载的所有文件统统剪切进去。

🚀 方法 B：使用魔搭官方下载工具（文件大、防止断线推荐用这个）

因为模型总共有好几个G，如果网页下载容易断线，可以用阿里官方的小工具：

访问魔搭官方下载器网页：[https://modelscope.cn/download](https://modelscope.cn/download)
根据你的书桌电脑系统（Windows 还是 Mac），下载对应的客户端软件。
打开软件，在搜索框里输入：ZhipuAI/glm-4-voice-9b-gptq-int4。
点击下载，它就会非常稳定地把整个模型文件夹完整地下载到你的电脑上。

🚚 第三步：把模型文件夹搬进 fNOS 系统

现在，模型的完整文件夹已经在你眼前的书桌电脑上了。我们要把它上传到第一步建好的 fNOS“小仓库”里。

回到你浏览器里的 fNOS 文件管理器 网页。
确保你正处于 /Volume1/Docker/glm4-voice/models 这个空文件夹内部。
鼠标选中你书桌电脑上下载好的 glm-4-voice-9b-int4 整个文件夹。
按住鼠标左键别松手，直接把它拖拽（Drag and Drop）到 fNOS 文件管理器的网页空白处。
此时 fNOS 网页右下角会跳出上传进度条。由于这是局域网传输，速度通常在每秒几十到上百兆，稍微喝杯茶等它传完。

🏁 本关通关任务：

传完之后，请检查：双击进入 fNOS 的 models 文件夹，能看到 glm-4-voice-9b-int4 文件夹，再点进去能看到一堆模型文件。

只要达到这个状态，模型下载这一关你就彻底满分通过了！

完成了这一步，请在评论区回复我：“模型已成功躺进 fNOS 的 models 文件夹！”选择 USB 全向麦克风直连 SER8 是真正能把 GLM-4-Voice 端到端语音模型的“智商、语气、低延迟”发挥到极致的硬核路线。

既然你的底层系统是 fNOS（基于 Debian 12），我们的核心目标就是：让 fNOS 里的 Docker 容器，能够直接“看”到并控制插在 SER8 上的物理 USB 麦克风和音箱。

为了让你一次性成功，我们不走复杂的纯代码编译路线，直接使用目前社区最成熟的 Gradio Web-Audio / 纯本地硬件直通 双管齐下的标准步骤。

🏁准备工作：硬件连接与 fNOS 认卡

硬件物理连接：
- 把你的 USB 全向麦克风（或麦克风扬声器一体机）插到 SER8 的后置或前置 USB 接口上。
- 如果音箱和麦克风是分离的，确保音箱也插在 SER8 的 3.5mm 音频口或另一个 USB 口上。
确认 fNOS 已经识别到声卡：
- 登录你 fNOS 的 Web 管理后台。
- 只要是标准的免驱 USB 麦克风，fNOS 的底层 Linux（Debian 12 内核）会自动加载驱动，你可以暂时不用管它，接下来的 Docker 配置才是重头戏。

🏁 第一步：在 fNOS 文件管理器中准备模型

GLM-4-Voice-INT4 包含三个协同工作的组件（音频 Tokenizer、9B 主模型、流式音频解码器）。

打开 fNOS 的 “文件管理器”。
在你的主存储空间（例如 Volume1/Docker）下，新建一个文件夹，命名为 glm4-voice。
在 glm4-voice 文件夹内部，再新建一个子文件夹，命名为 models。
将你下载好的 glm-4-voice-9b-int4 完整模型权重文件夹，拷贝到这个 models 文件夹中。

🏁 第二步：在 fNOS 创建“特权级”Docker 容器

这一步非常关键！普通的 Docker 容器是没有权限访问 SER8 物理声卡的，我们必须在 fNOS 的高级设置里进行“物理设备直通”。

进入 fNOS 的 Docker 管理应用 $\rightarrow$ “镜像仓库”。
搜索并下载社区最常用的集成镜像：singulariit/glm-4-voice（或带有 latest 标签的官方/社区 Gradio 版本）。
下载完成后，点击 “创建容器”，名称填 glm4-voice，勾选“开机自动启动”。
进入【高级设置】（核心修改点）：
- 网络模式： 切换为 host（主机模式），或者映射端口 7860:7860。
- 存储卷（挂载模型）：
  - 添加一行：本地路径选择 /Volume1/Docker/glm4-voice/models $\rightarrow$ 映射到容器内路径填 /app/models。
- 设备直通（赋予声卡权限）：
  - 在高级设置中寻找 “设备 (Devices)” 或者是 “添加设备” 选项。
  - 添加宿主机路径：/dev/snd $\rightarrow$ 容器内路径：/dev/snd。
  - （注：/dev/snd 是整个 Linux 系统的音频核心设备树，直通它，容器就能随意使用 SER8 的输入输出声音）。
- 特权模式（强制放权）：
  - 勾选 “以特权模式运行容器 (Privileged)”。如果不勾选这个，容器即使拿到了路径也会被安全策略拦截，导致无法录音。
点击 确定并启动容器。

🏁 第三步：启动与对讲测试

启动容器后，观察容器的“日志（Logs）”。
当日志中出现 Running on local URL: [http://0.0.0.0:7860](http://0.0.0.0:7860) 时，说明智普语音大脑已经在你的 SER8 里完全苏醒了！
网页端实时对讲：
- 在你书桌上的电脑浏览器里，输入 http://你的fNOS的IP:7860。
- 你会看到一个非常炫酷的语音交互界面。
- ⚠️ 浏览器隐私避坑： 还记得我们之前提到的吗？由于浏览器安全限制，非 HTTPS 默认不能用麦克风。请在 Chrome 浏览器输入 chrome://flags/#unsafely-treat-insecure-origin-as-secure，把你 fNOS 的 IP 地址和 7860 端口 填进去并设置为 Enabled，重启浏览器。
点击网页上的 “开始录音/实时对讲” 按钮，对着你书桌上的全向麦克风说一句话（比如：“嘿，小管家，听到我说话了吗？”）。
稍等不到 1 秒钟，SER8 强大的 8845HS 算力就会让你的桌面音箱里直接传出带有呼吸感、情绪起伏的纯正中文语音回复！

👨‍💻 现在的通关任务交给你：

去 fNOS 建立文件夹、把模型放进去，并用“特权模式 + host网络 + 直通 /dev/snd”的方式把 glm4-voice 容器创建出来！