数据科学工具链(numpy,pandas)Day2

Uncategorized
4.8k words

前言

接上次,了解到了创建虚拟环境可以带来很多好处,便学习了一下,并实操了venv创建虚拟环境,今天我继续学习了如何使用conda创建虚拟环境并进行了实操,并了解了一下基本存储机制,以及如何在这种方式创建的虚拟环境下安装pytorch,还了解了一下对应的cuda(toolkit).

下面这个链接是我和ChatGPT的聊天对话。

https://chatgpt.com/share/67f14d8b-62b4-8002-a8dd-a2a2e8710c39

使用conda创建虚拟环境

前提:anaconda/miniconda之前我已经安装好了anaconda再次不在赘述。

步骤

✅ 第一步:打开 Anaconda Prompt(或者普通 CMD 也行,我使用的Anaconda Prompt)

✅ 第二步:创建一个新的 conda 虚拟环境

这里我准备创建一个叫 aiproject 的 Python 3.10 环境(python版本可以自己根据需求定义)。

首先输入:conda create -n aiproject python=3.10

-n aiproject:虚拟环境名字(可随意更改)

(在哪个位置输入这行命令都一样,没有关系,待会儿进行详细介绍)

然后系统会开始检查版本,并提示你需要安装哪些包,需要输入:y。等待几分钟之,它会自动下载并安装所需内容。

✅ 第三步:激活这个环境(与位置有关)

先进入你想要使用这个环境的文件夹下:比如cd D:\MyProjects\AIProject

接着输入:conda activate aiproject

会看到提示符变成这样:

1
(aiproject) C:\Users\你的用户名>

这就表示现在已经“进入”了这个新的虚拟环境!

✅ 第四步:安装需要的第三方包(与位置无关)

比如我想要安装 pandasnumpymatplotlib,输入:

1
conda install pandas numpy matplotlib

或者使用 pip也没问题:

1
pip install pandas numpy matplotlib

安装完成后,这个环境就已经可以跑很多程序了!

👉 这些包是被安装到 E:\zancun\softwares\Anaconda2\envs\aiproject\Lib\site-packages 下的,而不是你项目目录!

✅ 第五步:测试是否安装成功(推荐)

输入:python

进入 Python 解释器,然后输入:

1
2
3
4
import pandas
import numpy
import matplotlib
print("✅ 所有库导入成功!")

如果没报错(输出“✅ 所有库导入成功!“),说明一切安装正确。输入 exit() 回到命令行。

✅ 第六步:退出虚拟环境(用完记得退)

输入:

1
conda deactivate

提示符前的 (aiproject) 消失,表示你现在已经退出虚拟环境。

questions

是不是使用conda创建的虚拟环境终端各种包都存在我电脑的E盘的Anaconda2下面?

✅ 1. 是的!conda 创建的虚拟环境默认都在电脑上的 Anaconda 安装目录下,不会存在项目目录中。

我电脑上装的是:

1
E:\zancun\softwares\Anaconda2\

那么我每次用以下命令创建虚拟环境的时候:

1
conda create -n aiproject python=3.10

它就会把虚拟环境存到这里:

1
E:\zancun\softwares\Anaconda2\envs\aiproject\

也就是说:

  • ✔ 所有包(numpy/pandas/matplotlib)
  • ✔ 环境自己的 python.exe
  • ✔ pip、conda、脚本工具

全都被自动放在这个独立的文件夹里。不用操心包在哪、是否冲突,它帮你隔离好了!

我的项目文件是不是可以存储在我想存的任何地方呀?

✅ 2. 是的!项目代码可以放在我想放的任何位置!

🌟 想放哪都行!只要在运行前激活环境即可

1
2
3
conda activate aiproject
cd D:\MyProjects\AIProject
python main.py

💡 项目的存储位置和虚拟环境的位置是彼此独立的!这就是 conda 的魅力:灵活 + 隔离

ChatGPT给我建议的项目结构:

1
2
3
4
5
6
AIProject/
├── main.py
├── utils/
├── data/
├── conda_guide.md
└── README.md

🚫 注意!不要混淆 venv 和 conda 的存放逻辑:

工具 包和解释器存哪? 项目代码存哪?
venv 默认存到你指定的项目目录下(项目内) 同一个文件夹,比较“绑定”
conda 默认都放在 Anaconda 安装目录的 envs/ 项目代码爱放哪放哪,自由隔离

🔄 也就是说:

操作 包会被存在哪里?
激活某个 conda 环境后安装包 存到该虚拟环境的 Lib\site-packages
没有激活环境、在 base 里装包 装到 base 环境中(默认的那个)
使用 venv 在项目中建虚拟环境 包会出现在项目目录下(比如 ./env/Lib/...

Anaconda 自带了 pandas/numpy,创建虚拟环境后还要再装一遍吗?

需要

✅ Anaconda 是个“巨型默认环境”

刚安装完 Anaconda 时,它自动帮你创建了一个叫做 base 的默认环境,这个环境里确实已经安装好了:

  • pandas numpy matplotlib scikit-learn jupyter

而且这些包都安装在:

1
E:\zancun\softwares\Anaconda2\ (base 环境路径)

❌ 但是!不建议在 base 环境里开发项目

原因如下:

原因 解释
容易冲突 base 环境太大,可能与你项目用到的版本冲突
不可控 升级包可能影响整个系统
无法复现 难以在别人的电脑重建 base 环境

✅ 推荐创建 自己的虚拟环境 来开发项目!

这样做的后果是:

🔧 新建的环境是 干净的默认是没有装任何第三方库的,你需要 自己选择需要什么装什么

比如新建的 aiproject 虚拟环境,默认只有:

  • Python 本体
  • pip、setuptools、wheel 这些基础工具

所以需要手动装:

1
conda install pandas numpy matplotlib

这样更轻量、更可控、更稳定!

在 conda 虚拟环境中安装 PyTorch

步骤

💡1. 先激活你要安装 PyTorch 的环境

1
conda activate aiproject

💡2. 根据需要选择安装相应的cudatoolkit

🌟 我的Anaconda的系统全局CUDA是11.8

如果你将要进行的项目需要的CUDA版本和全局CUDA版本不一样,需要升级/降级CUDA版本(如从11.8到12.1),则需要在安装pytorch之前进行一下操作(我暂时还没有进行实操):

  • 操作步骤
    1. 更新 **cudatoolkit**:

      1
      conda install cudatoolkit=12.1 -c nvidia
    2. 重新安装 PyTorch(确保 PyTorch 版本与新 CUDA 兼容):

      1
      conda install pytorch=2.1.0 torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
    3. 验证版本一致性:

      1
      python
      1
      2
      import torch
      print(torch.version.cuda) # 应显示 12.1

💡3. 去官方 PyTorch 安装指令生成器

打开这个网址(推荐收藏):

👉 https://pytorch.org/get-started/locally/

💡4. 根据需要和自己电脑的配置选择相应的配置

在如图界面进行选择

因为我有 Nvidia 显卡(支持 CUDA),所以就将上图中最后一行Run this Command中给的内容复制下来在Anaconda Prompt里跑就可以了,就会开始安装Pytoch了.

💡5. 安装完成后测试是否成功:

1
python
1
2
3
import torch
print(torch.__version__) #这个也可以用来查看该环境下的pytorch版本
print(torch.cuda.is_available()) # 如果是 CPU 版,这里是 False

✅ 成功导入就说明安装没问题啦!

Questions

🧠 一、在虚拟环境中安装的 PyTorch 是否对整个 Anaconda 都适用?

❌ 不适用!

PyTorch(或任何包)一旦安装在某个虚拟环境中就只在这个虚拟环境中可用,对其他环境(包括 base 环境)无效。

这正是虚拟环境的本质——隔离

🧠 二、如果我在另一个新环境中也想用 PyTorch,是否要重新安装?

✅ 是的,你需要在每个需要 PyTorch 的虚拟环境中重新安装一次

🧠 三、如果我不在虚拟环境(在base环境)中安装 PyTorch 会有什么后果?

如果你在 base 环境 或没激活任何环境的终端中直接运行:

1
conda install pytorch torchvision torchaudio -c pytorch

那么 PyTorch 会被安装到你的 base 环境里,这样带来的问题是:

🚨 后果一:污染 base 环境

容易和 Anaconda 自带的包冲突,搞出各种奇怪问题(版本不一致、运行报错等)。

🚨 后果二:无法复现

别人不能复制你的项目环境,只能干瞪眼说 “为什么我运行不了?”

🚨 后果三:不推荐开发!!!

base 环境是整个 Anaconda 的核心系统,出问题可能让所有环境都出问题!

🛡️ 最佳实践总结表

操作行为 建议 or 结果
在 base 环境中装 PyTorch ❌ 不推荐
在自己创建的虚拟环境中装 PyTorch ✅ 强烈推荐
想要多个项目使用 PyTorch 每个环境分别安装一次
不小心装错了 conda uninstall 卸载重新来

🧠 四、如何快速查看环境中是否有某个包呢?

💡 小技巧:一条命令快速查看环境中是否有某个包

你可以用这个命令:

1
**conda list | findstr torch**

它会过滤出环境中含 “torch” 的所有包,清晰明了 ✅

✅ 额外:快速列出所有环境的位置

1
conda env list

你会看到:

1
2
3
4
5
# conda environments:
#
base * E:\zancun\softwares\Anaconda2
aiproject E:\zancun\softwares\Anaconda2\envs\aiproject
...

这让你明确知道:当前激活的是哪个环境,它的路径是哪里(*标记的是当前所在环境)。

如何在 VS Code / PyCharm 使用虚拟环境?

🧩 VS Code 设置虚拟环境(推荐)

  1. 打开你的项目文件夹(比如 ai project
  2. Ctrl + Shift + P 打开命令面板
  3. 输入并选择 👉 Python: Select Interpreter
  4. 找到你创建的虚拟环境路径,像这样:

(Conda) aiproject: Python 3.10 (E:\zancun\softwares\Anaconda2\envs\aiproject\python.exe)

选择后,终端就会自动激活你这个环境!运行、调试都没问题~

🧩 PyCharm 设置 Conda 虚拟环境

  • 打开项目后,点击右下角的 Python 解释器设置
  • 点击 添加新的解释器 → 选择 添加本地解释器...
  • 在新的窗口选择 选择现有类型选择 Conda环境选择你所在环境的名字→ 确定

好啦,今天先到这里,也算是终于理清了两种配置虚拟环境的方法,也弄清楚了该如何安装、改变相应的CUDA,Pytorch。依然和上次一样,ChatGPT给了我好多Bonus,比如“PyTorch 虚拟环境复用模版”,一键配置 PyTorch 环境” 的 .bat 脚本。

但是由于现在我还没有做具体的的项目,文件夹里其实也是只有一个main.py,等我过几天把张岩导师发的几篇论文的代码库拉取下来再进行尝试叭~下次差不多就可以开始真正对于pandas,numpy等的学习啦,加油加油!!

Comments