保姆级教程：在Windows上用Anaconda+PyTorch 2.2.2部署通义千问Qwen-1.8B-Chat模型（含报错解决）-港品优选

Windows平台Anaconda+PyTorch 2.2.2部署Qwen-1.8B-Chat全流程实战

最近在本地机器上折腾大语言模型部署的朋友越来越多，特别是像通义千问Qwen这样的开源模型。不过Windows用户总会遇到些Linux/Mac上不会出现的"特色问题"。今天我们就用最接地气的方式，从零开始完整走一遍Qwen-1.8B-Chat模型的部署流程，重点解决那些让人抓狂的报错。

1. 环境准备：打造专属Python沙盒

1.1 Anaconda安装与配置

首先去Anaconda官网下载最新的Windows版本安装包。安装时务必勾选"Add Anaconda to my PATH environment variable"选项，这样后面在普通CMD里也能使用conda命令。安装完成后，打开Anaconda Prompt（这个比普通CMD好用），我们开始创建专属环境：

conda create -n qwen python=3.11 -y conda activate qwen

注意：如果之前安装过Anaconda但没添加到PATH，可以在开始菜单找到"Anaconda Prompt"专门用来管理环境。

1.2 PyTorch GPU版本安装

PyTorch版本和CUDA版本的匹配是个大坑。经过实测，以下组合在RTX 30/40系列显卡上最稳定：

conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=12.1 -c pytorch -c nvidia

安装完成后验证是否识别到GPU：

import torch print(torch.cuda.is_available()) # 应该返回True print(torch.version.cuda) # 应该显示12.1

如果返回False，八成是CUDA驱动没装对。去NVIDIA官网下载对应显卡的CUDA 12.1驱动重新安装。

2. 项目部署：从克隆到报错解决

2.1 克隆Qwen官方仓库

找个合适的目录执行：

git clone https://github.com/QwenLM/Qwen cd Qwen

2.2 安装依赖时的坑

官方requirements.txt里的依赖可能不全，建议先安装这些基础包：

pip install numpy ninja pyyaml mkl mkl-include setuptools cmake cffi typing_extensions future six requests dataclasses

然后再安装requirements.txt：

pip install -r requirements.txt

这时候大概率会遇到著名的charset_normalizer报错：

ImportError: cannot import name 'COMMON_SAFE_ASCII_CHARACTERS' from 'charset_normalizer.constant'

解决方法分两步走：

pip uninstall charset_normalizer -y pip install charset_normalizer==2.0.12 --user

这个特定版本(2.0.12)经测试最稳定，新版本反而会有兼容性问题。

3. 模型下载：魔搭社区实战

3.1 安装ModelScope

先安装阿里云的ModelScope库：

pip install modelscope

如果下载速度慢，可以换国内源：

pip install modelscope -i https://mirrors.aliyun.com/pypi/simple/

3.2 编写下载脚本

新建一个download_model.py文件，内容如下：

from modelscope import snapshot_download # 1.8B模型下载 model_dir = snapshot_download('qwen/Qwen-1_8B-Chat', cache_dir='./model', revision='master')

运行时会显示下载进度条。如果中断了也没关系，下次运行会自动续传。

提示：7B模型只需要把Qwen-1_8B-Chat改成Qwen-7B-Chat即可，但需要至少16GB显存才能流畅运行。

4. 启动交互：CLI与Web Demo

4.1 命令行交互模式

基础启动命令：

python cli_demo.py --model-dir ./model/qwen/Qwen-1_8B-Chat

常用交互命令：

输入:h查看帮助
输入:his查看历史记录
输入:clear清空对话

4.2 Web版交互界面

如果想用浏览器操作：

python web_demo.py --model-dir ./model/qwen/Qwen-1_8B-Chat

默认会在7860端口启动服务，浏览器打开http://localhost:7860即可。

5. 性能优化技巧

5.1 量化加速

如果觉得推理速度慢，可以尝试4bit量化：

from transformers import AutoModelForCausalLM model = AutoModelForCausalLM.from_pretrained( "./model/qwen/Qwen-1_8B-Chat", device_map="auto", trust_remote_code=True, load_in_4bit=True )

5.2 内存优化

修改web_demo.py中的这行参数可以减少内存占用：

model.eval().cuda() # 改为 model.eval().cuda().half() # 使用半精度浮点数

6. 常见问题排查

6.1 CUDA内存不足

错误信息通常长这样：

RuntimeError: CUDA out of memory.

解决方法：

尝试减小max_length参数
使用--load-in-8bit参数
关闭其他占用显存的程序

6.2 文件权限问题

Windows特有的路径问题可能导致：

PermissionError: [Errno 13] Permission denied

解决方法：

不要安装在C盘根目录或Program Files下
以管理员身份运行Anaconda Prompt
检查文件夹是否有写入权限

我在实际部署中发现，最稳定的环境组合是：

Windows 11 22H2
NVIDIA Driver 536.67
CUDA 12.1
PyTorch 2.2.2
Python 3.11.4

这套配置连续运行48小时没出现任何崩溃。如果遇到随机崩溃，建议先检查显卡驱动是不是最新版。

企业官网建设流程全解析

Windows平台Anaconda+PyTorch 2.2.2部署Qwen-1.8B-Chat全流程实战

1. 环境准备：打造专属Python沙盒

1.1 Anaconda安装与配置

1.2 PyTorch GPU版本安装

2. 项目部署：从克隆到报错解决

2.1 克隆Qwen官方仓库

2.2 安装依赖时的坑

3. 模型下载：魔搭社区实战

3.1 安装ModelScope

3.2 编写下载脚本

4. 启动交互：CLI与Web Demo

4.1 命令行交互模式

4.2 Web版交互界面

5. 性能优化技巧

5.1 量化加速

5.2 内存优化

6. 常见问题排查

6.1 CUDA内存不足

6.2 文件权限问题

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

Windows平台Anaconda+PyTorch 2.2.2部署Qwen-1.8B-Chat全流程实战

1. 环境准备：打造专属Python沙盒

1.1 Anaconda安装与配置

1.2 PyTorch GPU版本安装

2. 项目部署：从克隆到报错解决

2.1 克隆Qwen官方仓库

2.2 安装依赖时的坑

3. 模型下载：魔搭社区实战

3.1 安装ModelScope

3.2 编写下载脚本

4. 启动交互：CLI与Web Demo

4.1 命令行交互模式

4.2 Web版交互界面

5. 性能优化技巧

5.1 量化加速

5.2 内存优化

6. 常见问题排查

6.1 CUDA内存不足

6.2 文件权限问题

热门文章

文章分类

标签云

相关文章

AcuRite停用旧应用推新平台，功能缺失与付费服务引老用户不满

别再傻傻分不清GTF和GFF3了！用gffread一键互转的保姆级教程

告别串口助手：用Python脚本实现YMODEM协议自动升级嵌入式固件（附源码）

需要专业的网站建设服务？