Ollama本地部署代码大模型 + 对接开源Codex完整教程
先分清两个关键概念,避免混淆:
- OpenAI Codex:闭源云端编程模型,本地无法直接部署;
- Ollama官方集成的Codex(开源OSS Codex):独立开源本地编程智能体框架,可完全跑本地代码模型(CodeLlama/DeepSeek-Coder/Qwen-Coder),就是你Cursor里的子智能体、worktree派生功能底层载体。
一、第一步:安装Ollama运行环境
1. 下载安装
官网:https://ollama.com/
- Windows/Mac:双击安装包一键安装;
- Linux:一行脚本安装
curl-fsSLhttps://ollama.com/install.sh|sh2. 验证安装
新开终端执行,输出版本号即成功:
ollama--version默认后台服务地址:http://127.0.0.1:11434
二、第二步:拉取本地代码大模型(三档硬件选择)
根据你的内存选对应模型,代码专用模型推荐:
低配电脑(8G内存,轻薄本)
# 7B轻量化代码模型,中文友好ollama pull qwen2.5-coder:7b中端电脑(16G内存,游戏本)
# 平衡性能,多语言代码强ollama pull deepseek-coder:13b高配(32G+内存/独立显卡)
# 专业项目、多文件重构、子智能体并行开发ollama pull codellama:34b-instruct# 或通义千问代码大模型ollama pull qwen2.5-coder:32b这种方式只适合自己电脑有独立显卡,并且内存比较大的情况。
下面以一台32g内存+8g独显的电脑安装 qwen2.5:14b-instruct-q4_K_M模型为例。实际上这个配置也不高,只能勉强安装
ollama pull qwen2.5:14b-instruct-q4_K_M
部署成功
测试模型能否正常运行
ollama run qwen2.5:14b-instruct-q4_K_M# 输入一段代码需求,能正常输出代码即模型就绪三、第三步:启动本地开源Codex(Ollama OSS Codex)
方式1、以本地模型启动CodeX
在 CMD/PowerShell 里输入:
ollama launch codex-app它会自动打开 Codex 界面
自动读取你本地 Ollama 里的所有模型(包括你的 DeepSeek)
方式2:临时命令启动(单次使用)
--oss代表使用本地开源模式,-m指定你下载好的本地代码模型
# 基础启动,对接ollama本地7B代码模型codex--oss-mqwen2.5-coder:7b# 中端13B模型启动codex--oss-mdeepseek-coder:13b# 34B专业模型codex--oss-mcodellama:34b-instruct方式3:持久化配置
- 打开Codex配置文件
- Windows:
C:\Users\你的用户名\.codex\config.toml - Mac/Linux:
~/.codex/config.toml
- Windows:
- 粘贴Ollama配置片段:
# 绑定本地Ollama服务 [model_providers.ollama-local] name = "Ollama本地模型" base_url = "http://localhost:127.0.0.1:11434/v1" # 默认使用的本地代码模型 [profiles.local-coder] model = "qwen2.5-coder:7b" model_provider = "ollama-local"- 用配置文件一键启动Codex
codex--profilelocal-coder方式4:图形化Cursor编辑器对接本地Ollama Codex
如果你是在Cursor软件内使用Codex子智能体:
- 打开设置
Ctrl+,(Windows)/Cmd+,(Mac) - 搜索
AI Model Provider,切换为Custom - 自定义接口地址:
http://localhost:11434/v1 - 模型名填写你拉取的模型,例如
qwen2.5-coder:7b - API Key留空,保存后重启Cursor
- 所有子智能体、派生工作树、代码修改功能全部走本地模型,不联网云端
官方一键恢复
如果不想用ollama了,想还原codex最初的状态
方法 :官方一键恢复(推荐,最简单)
打开终端(CMD/PowerShell),执行:
ollama launch codex-app--restore作用:自动把 Codex 恢复成出厂默认(OpenAI/ChatGPT)
执行完完全关掉 Codex(不是关窗口,是退出程序),再重新打开
启动后会弹出ChatGPT 扫码登录,成功就切回去了
四、核心功能验证(选做)
- 本地Codex创建隔离工作树worktree
# 基于main分支新建隔离本地工作树,交给本地子智能体迭代gitworktreeadd-bcodex/local-test../local-coder-worktree main# 切换到新目录,codex会自动识别本地模型读写代码cd../local-coder-worktree codex--oss- 并行多子智能体(Subagent)本地运行
多开终端,分别执行不同模型配置,每个终端对应一个独立子智能体,互不占用云端额度:
# 终端1:前端子智能体codex--oss-mqwen2.5-coder:7b--profilefrontend# 终端2:后端接口子智能体codex--oss-mdeepseek-coder:13b--profilebackend五、常见问题修复
1. codex命令找不到
原因:未安装开源Codex客户端
解决:
# Windows/Mac/Linux一键安装Codex客户端ollamainstallcodex2. Ollama连接超时
检查ollama后台是否运行,重启服务:
# Windowsollama stop&&ollama start# Mac/Linuxsystemctl restart ollama3. 内存不足、模型加载卡顿
- 切换更小参数量模型(7B优先);
- Ollama启动时开启GPU加速,N卡自动启用,AMD需额外配置;
- 关闭后台占用内存软件。
4. GitHub CLI不可用不影响本地Codex
本地模型仅依赖Git本体管理worktree/分支,gh只是推送云端增强工具,纯本地开发可以不装。
六、关键区分避坑
- 闭源OpenAI Codex:只能云端调用API,无法本地部署;
- Ollama OSS Codex:开源本地编程智能体框架,搭配CodeLlama/通义千问代码模型,完全离线运行,支持子智能体、Git工作树、代码重构;
- 本地Codex完整能力:派生分支、隔离worktree、多Subagent并行、文件读写、Git提交,和你截图里Cursor侧边栏功能完全一致,区别是算力全在本机。
极简快速上手流程总结
- 装Ollama → 2. 拉取代码模型 → 3. codex --oss 启动本地智能体 → 4. 对接Cursor编辑器,自由创建worktree、子智能体离线写代码。