Claude Code + LM Studio + CC-Switch 本地自动化编程部署指南
2026/5/25 16:44:00 网站建设 项目流程

Claude Code + LM Studio + CC-Switch 本地自动化编程部署指南

本指南汇总了在 Windows 本地环境下,使用 Claude Code 配合 LM Studio 本地模型、CC-Switch 代理进行自动化编程开发的完整配置方案。


目录

  1. 硬件与模型选型
  2. LM Studio 本地模型部署
  3. CC-Switch 代理配置
  4. Claude Code 配置
  5. 自动化编程工作流
  6. TMSim 项目实战模板
  7. 常见问题排查

一、硬件与模型选型

1.1 硬件参考(RTX 3060 Ti 12GB)

指标推荐配置
GPURTX 3060 Ti 12GB
显存可用约 10~11 GB(系统预留 1~2GB)
适合模型规模7B~14B(Q4_K_M 量化)

1.2 模型推荐(按编码能力排序)

首选:Qwen2.5-Coder-14B-Instruct
项目详情
量化推荐Q4_K_M(约 8.5GB)或Q5_K_S(约 9.5GB)
显存占用8.5 ~ 9.5 GB
编码能力当前开源编码最强之一,支持 92 种编程语言
3060Ti 速度Q4_K_M 约18-28 tok/s
LM Studio 搜索Qwen2.5-Coder-14B-Instruct-GGUF
备选:Qwen3-14B
项目详情
量化推荐Q4_K_M(约 8.4GB)
特点全能型,支持 Thinking / Non-thinking 双模式
3060Ti 速度20-30 tok/s
极速版:Qwen2.5-Coder-7B
项目详情
量化推荐Q6_K(约 6GB)
特点显存占用低,响应极快
3060Ti 速度40-60 tok/s

1.3 量化选择优先级

Q4_K_M → 平衡首选(推荐) Q5_K_S → 质量稍好,14B 在 12GB 下仍安全 Q6_K → 7B 模型可以上,14B 不建议(太紧张)

二、LM Studio 本地模型部署

2.1 下载与加载模型

  1. 打开LM Studio
  2. 左侧Search→ 搜索模型名称(如Qwen2.5-Coder-14B-Instruct-GGUF
  3. 选择lmstudio-community发布的版本
  4. 下载Q4_K_MQ5_K_S量化版本
  5. 加载模型

2.2 启动本地 API 服务

  1. 点击左侧DeveloperStart Server
  2. 关键配置:
配置项说明
Port1234默认端口
Enable CORS必须打开Claude Code 跨域需要
API Key留空或lm-studio本地通常不强制校验
  1. 确认端点可用:
http://localhost:1234/v1
  1. 验证模型列表(浏览器访问):
http://localhost:1234/v1/models

2.3 性能优化设置

加载模型后,右侧设置:

配置项推荐值
Context Length40968192(编码任务不需要太长)
GPU OffloadMax(全部层放 GPU)
Batch Size512 或 1024

⚠️ 如果显存紧张,Context Length 降到 4096。


三、CC-Switch 代理配置

3.1 CC-Switch 简介

CC-Switch 是一个带 GUI 的代理工具,让 Claude Code 能一键切换不同模型供应商(本地 LM Studio、Kimi、DeepSeek 等)。

3.2 添加本地 LM Studio Provider

  1. 打开 CC-Switch 桌面应用
  2. 点击右上角+Add New Provider
  3. 填写参数:
字段
Provider NameLM-Studio-Local(自定义)
API Endpointhttp://localhost:1234/v1
API Keylm-studio(或任意占位符)
API 格式OpenAI 兼容⚠️必须选这个!
认证字段ANTHROPIC_AUTH_TOKEN(默认)

⚠️关键:LM Studio 的/v1端点是OpenAI 兼容格式,不是 Anthropic 原生格式。如果 CC-Switch 没有 “OpenAI 兼容” 选项,说明该版本不支持本地 OpenAI 模型,需换claude-code-routerLiteLLM

3.3 模型映射填写

本地只有一个模型,三个角色都填同一个

模型角色显示名称实际请求模型声明支持 1M
SonnetQwen Coder 14B[LM Studio 准确ID]❌ 不勾选
OpusQwen Coder 14B[LM Studio 准确ID]❌ 不勾选
HaikuQwen Coder 14B[LM Studio 准确ID]❌ 不勾选

获取准确模型 ID

  • 浏览器访问http://localhost:1234/v1/models
  • 复制data[0].id字段的值(如qwen2.5-coder-14b-instruct
  • 必须一字不差,包括大小写和连字符

3.4 添加 Kimi Provider(云端备选)

字段
Provider NameKimi-Moonshot
API Endpointhttps://api.moonshot.cn/v1
API 格式OpenAI 兼容
API Key你的sk-xxxMoonshot Key
Sonnet/Opus 实际模型kimi-k2.6
Haiku 实际模型kimi-k2.5kimi-k2-turbo-preview

⚠️kimi-k2.6默认 thinking 模式,temperature 锁定为 1.0,不要手动传 temperature 参数。

3.5 启动代理

  1. 在 CC-Switch 里启用目标 Provider
  2. 确认本地代理已启动(默认http://127.0.0.1:15721
  3. 完全关闭CC-Switch 再重新打开(确保配置生效)

四、Claude Code 配置

4.1 settings.json 配置

文件路径:~/.claude/settings.json(Windows 通常是C:\Users\你的用户名\.claude\settings.json

本地模型配置(LM Studio):

{"env":{"ANTHROPIC_BASE_URL":"http://127.0.0.1:15721","ANTHROPIC_AUTH_TOKEN":"PROXY_MANAGED","ANTHROPIC_MODEL":"qwen2.5-coder-14b-instruct","ANTHROPIC_DEFAULT_OPUS_MODEL":"qwen2.5-coder-14b-instruct","ANTHROPIC_DEFAULT_SONNET_MODEL":"qwen2.5-coder-14b-instruct","ANTHROPIC_DEFAULT_HAIKU_MODEL":"qwen2.5-coder-14b-instruct","CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC":"1","CLAUDE_CODE_EFFORT_LEVEL":"max"}}

Kimi 云端配置:

{"env":{"ANTHROPIC_BASE_URL":"http://127.0.0.1:15721","ANTHROPIC_AUTH_TOKEN":"PROXY_MANAGED","ANTHROPIC_MODEL":"kimi-k2.6","ANTHROPIC_DEFAULT_OPUS_MODEL":"kimi-k2.6","ANTHROPIC_DEFAULT_SONNET_MODEL":"kimi-k2.6","ANTHROPIC_DEFAULT_HAIKU_MODEL":"kimi-k2.5","CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC":"1","CLAUDE_CODE_EFFORT_LEVEL":"max"}}

4.2 验证连接

  1. 完全关闭终端和 Claude Code
  2. 重新启动 Claude Code
  3. 输入:
/model

确认菜单显示的是你配置的模型名称

  1. 测试对话:
hello, which model are you using now?

五、自动化编程工作流

5.1 核心思路

让 Claude Code全自动、零干预地实现项目:

  • 把设计方案作为永久上下文(CLAUDE.md)
  • 分阶段交付
  • 提前授权所有操作

5.2 创建 CLAUDE.md 宪法文件

在项目根目录创建CLAUDE.md,Claude Code 启动时会自动读取。

模板结构:

# 项目名 — 开发宪法 ## 技术栈 - Python 3.10+ - numpy, scipy, matplotlib, pytest - PyQt6(UI层) ## 开发原则(强制执行) 1. **测试驱动**:每写一个模块,必须同时写对应的 pytest 单元测试 2. **零UI依赖**:core/ 目录下的模块不得导入任何 GUI 库 3. **自动安装**:遇到缺失依赖时,自动执行 `pip install` 安装 4. **无需询问**:直接执行所有操作,不需要用户确认 ## 目录结构(严格遵守) project/ ├── core/ # 模型库(零UI依赖) ├── engine/ # 仿真引擎 ├── gui/ # UI可视化 ├── tests/ # 单元测试 + 验收测试 └── examples/ # 示例脚本 ## 实现顺序(分阶段,禁止跳阶段) ### Phase 1:核心闭环(最高优先级) - 模块 A + 单元测试 - 模块 B + 单元测试 - 闭环集成测试 ### Phase 2:架构完善 ... ## 关键参数(不可改动) - param1 = xxx - param2 = yyy ## 代码规范 - 使用类型注解 - 所有物理量标注单位 - 角度统一用 rad ## 权限声明 你被授权: - 读取/写入项目目录下所有文件 - 自动安装 Python 依赖 - 自动创建目录和文件 - 执行 pytest 运行测试 - 不需要询问用户确认,直接执行

5.3 分阶段实现策略

不要一次性让它做完整项目!

会话目标预计时间
第 1 次Phase 1:核心算法 + 单元测试30-60 分钟
第 2 次Phase 2:架构 + 集成30-60 分钟
第 3 次Phase 3:扩展功能60-90 分钟
第 4 次Phase 4:可视化 + 最终集成60-90 分钟

每次启动新会话时,先让它Read CLAUDE.md回顾上下文,然后指定当前 Phase。

5.4 一键启动 Prompt

保存为prompt.txt,每次启动 Claude Code 时粘贴:

/read CLAUDE.md 请执行 Phase X(替换为当前阶段): 1. 自动创建所有目录和文件 2. 严格按设计文档实现代码 3. 每模块配 pytest 测试 4. 运行验收测试并自动修复至通过 5. 数值误差 < 2% 6. 无需询问,直接执行 完成后汇报:文件清单 + 测试结果 + 已知问题

六、TMSim 项目实战模板

6.1 项目架构(四层模型)

┌─────────────────────────────────────────┐ │ UI可视化层(PyQt6 + Matplotlib) │ │ ├─ 参数配置面板 │ │ ├─ 实时曲线绘制(时域阶跃、频域伯德图)│ │ └─ 根轨迹图 │ ├─────────────────────────────────────────┤ │ 仿真引擎层(调度、积分、事件检测) │ │ ├─ 数值积分器(RK4 定步长) │ │ ├─ 多速率调度器(1000/200/50 Hz) │ │ └─ 事件检测(命中、脱靶、舵饱和) │ ├─────────────────────────────────────────┤ │ 模型库层(算法核心,零UI依赖) │ │ ├─ 弹体动力学(线性/非线性) │ │ ├─ 舵机传感器 │ │ ├─ 过载驾驶仪(2回路/PI/3回路) │ │ ├─ 制导律(PN/OPN/LOS) │ │ └─ 导引头 + 雷达 │ ├─────────────────────────────────────────┤ │ 数据管理层(记录、导出、后处理) │ │ ├─ 时序记录器(HDF5) │ │ └─ CSV导出 + 统计分析 │ └─────────────────────────────────────────┘

6.2 标准数据包定义(5大总线)

fromdataclassesimportdataclassfromtypingimportOptional@dataclassclassTrueStateBus:"""1000Hz,来自六自由度积分器"""timestamp:floatpos_x:float;pos_y:float;pos_z:floatvel_x:float;vel_y:float;vel_z:floatroll:float;pitch:float;yaw:floatomega_x:float;omega_y:float;omega_z:floatlos_angle:float;range_:float;range_rate:float@dataclassclassNavDataBus:"""200Hz,来自传感器组件"""timestamp:floataccel_y_meas:floatomega_z_meas:floatlos_angle_rate_est:float@dataclassclassGuidanceCmdBus:"""50Hz,来自制导律"""timestamp:floatay_cmd:floataz_cmd:floatgamma_cmd:floatt_go:Optional[float]=None@dataclassclassActuatorCmdBus:"""200Hz,来自驾驶仪"""timestamp:floatdelta_x:float;delta_y:float;delta_z:float@dataclassclassForceMomentBus:"""1000Hz,来自舵机动力学"""timestamp:floatforce_x:float;force_y:float;force_z:floatmoment_x:float;moment_y:float;moment_z:float

6.3 关键教材参数(不可改动)

# 弹体线性化参数(表4.1-1)a_alpha=72.4# s^-2a_delta=471.0# s^-2a_omega=1.5# s^-2b_alpha=1.27# s^-1b_delta=0.477# s^-1c=0.66# mV=1140.0# m/s# 驾驶仪参数(两回路)K_A=0.00065# s^2/(m·N)K_g=0.0728# s# 舵机参数k_r=-0.0175tau=0.0133# s

6.4 验收标准(Week 1)

# 图4.1-8 单位阶跃过载响应# 条件1:初始下冲(t=0.05s)assert-0.25<ay_down<-0.15# 条件2:稳态值(t>0.4s)assert0.78<ay_ss<0.80# 条件3:调节时间assertt_settle<0.4# 条件4:无NaNassertnotnp.isnan(ay_array).any()

七、常见问题排查

7.1 CC-Switch 相关问题

问题原因解决
没有 “OpenAI 兼容” 选项版本只支持 Anthropic 后端claude-code-routerLiteLLM
401 Invalid AuthenticationKey 错误或端点混用确认端点和 Key 匹配
404 Model Not Found模型 ID 拼写错误http://localhost:1234/v1/models复制准确名称
400 invalid temperaturekimi-k2.6 默认 thinking 模式锁定 temperature=1.0不传 temperature 参数,或换模型

7.2 LM Studio 相关问题

问题原因解决
CORS 错误LM Studio 没开 CORSDeveloper → 勾选 Enable CORS
模型加载失败显存不足换更小的量化版本或减小 Context Length
响应极慢GPU Offload 不够右侧设置 GPU Offload 拉到 Max

7.3 Claude Code 相关问题

问题原因解决
pip: command not found环境 PATH 问题python -m pip代替
测试一直失败实现逻辑错误暂停测试,先检查数学公式推导
想改参数让测试通过参数是宪法制止!参数不可改,只能改代码
上下文溢出文件太多重启会话,基于已有代码继续

7.4 本地模型 Tool Calling 问题

Qwen 本地量化版在 Claude Code 的 agentic 模式(自动读写文件、执行命令)下可能不稳定:

Failed to parse tool call: Unexpected end of content. Failed to parse tool call: Expected ""name"", but got ""name" at index 13.

解决:

  • 这是模型输出格式不符合 Claude Code 的 XML tool use 格式
  • 换更强的模型(14B 比 7B 稳定)
  • 或降低任务复杂度,分步执行

附录:替代工具

如果 CC-Switch 不满足需求,可考虑:

工具定位安装
claude-code-proxyClaude Code 专用,原生支持 Kimi Codebrew install raine/claude-code-proxy/claude-code-proxy
claude-code-router本地模型专用,支持 LM Studio/Ollamanpm install -g @musistudio/claude-code-router
UniClaudeProxy通用全能,支持任意后端pip install uniclaudproxy
LiteLLM企业网关,100+ 模型pip install litellm

文档版本:v1.0
更新日期:2026-05-24

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询