这里说的“源”,全称是 Python包管理源(也叫PyPI镜像源),本质是一个“存放Python第三方库(比如datasets、addict)的服务器仓库”。
你可以把它理解成:Python第三方库的“应用商店服务器” —— 当你用pip install 库名安装软件时,pip会从这个“服务器”上下载对应的库文件,再安装到你的电脑里。
• 默认源(官方源):pip默认使用的是Python官方的PyPI源(地址:https://pypi.org/simple/),所有Python第三方库的官方版本都存放在这里。
• 国内源(镜像源):因为官方源的服务器在国外,国内用户访问时可能出现:
o 网络延迟高(下载慢);
o 网络波动导致下载中断(就是你之前遇到的报错);
o 部分地区访问不稳定。
所以国内的科技公司(阿里、清华、豆瓣等)会搭建“镜像源”—— 相当于把官方源里的所有库文件,复制一份到国内的服务器上,让国内用户能从就近的服务器下载,速度和稳定性都会大幅提升。
源名称 源地址(pip安装时用)
阿里云镜像源 https://mirrors.aliyun.com/pypi/simple/
清华镜像源 https://pypi.tuna.tsinghua.edu.cn/simple/
豆瓣镜像源 https://pypi.doubanio.com/simple/
中科大镜像源 https://pypi.mirrors.ustc.edu.cn/simple/
两种常用方式,解决你之前的安装失败问题:
方式1:临时使用(安装单个库时指定)
安装命令后面加 -i 源地址 即可,比如:
# 用阿里云源安装datasets库
pip install datasets -i https://mirrors.aliyun.com/pypi/simple/
# 用清华源安装modelscope完整依赖
pip install modelscope[all] -i https://pypi.tuna.tsinghua.edu.cn/simple/
方式2:永久配置(以后所有pip安装都自动用国内源)
避免每次都手动写源地址,推荐配置永久源(以Windows为例):
1. 打开CMD命令行,执行以下命令(用阿里云源举例):
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
2. 配置成功后,以后直接执行 pip install 库名,就会自动从国内源下载,无需再加 -i 参数。
“源”就是pip下载第三方库的“服务器地址”,换国内源的核心目的是 解决国外服务器下载慢、不稳定、中断的问题,让你能顺利安装datasets这类依赖库。
你现在可以直接用方式1的命令,换国内源重新安装datasets,就能解决之前的报错啦~