图形处理器
NVIDIA
Ollama 支持计算能力为 5.0+ 的 Nvidia GPU。
检查您的计算兼容性,看看您的卡是否受支持:https://developer.nvidia.com/cuda-gpus
计算能力 | 家庭 | 卡 |
---|---|---|
9.0 | NVIDIA | H200 H100 |
8.9 | GeForce RTX 40xx 显卡 | RTX 4090 RTX 4080 SUPER RTX 4080 RTX 4070 Ti SUPER RTX 4070 Ti RTX 4070 SUPER RTX 4070 RTX 4060 Ti RTX 4060 |
NVIDIA 专业 | L4 L40 RTX 6000 |
|
8.6 | GeForce RTX 30xx 系列 | RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 RTX 3060 Ti RTX 3060 RTX 3050 Ti RTX 3050 |
NVIDIA 专业 | A40 RTX A6000 RTX A5000 RTX A4000 RTX A3000 RTX A2000 A10 A16 A2 |
|
8.0 | NVIDIA | A100 A30 |
7.5 | GeForce GTX/RTX | GTX 1650 Ti TITAN RTX RTX 2080 Ti RTX 2080 RTX 2070 RTX 2060 |
NVIDIA 专业 | T4 RTX 5000 RTX 4000 RTX 3000 T2000 T1200 T1000 T600 T500 |
|
Quadro | RTX 8000 RTX 6000 RTX 5000 RTX 4000 |
|
7.0 | NVIDIA | TITAN V V100 Quadro GV100 |
6.1 | NVIDIA TITAN | TITAN Xp TITAN X |
GeForce GTX | GTX 1080 Ti GTX 1080 GTX 1070 Ti GTX 1070 GTX 1060 GTX 1050 Ti GTX 1050 |
|
Quadro | P6000 P5200 P4200 P3200 P5000 P4000 P3000 P2200 P2000 P1000 P620 P600 P500 P520 |
|
Tesla | P40 P4 |
|
6.0 | NVIDIA | Tesla P100 Quadro GP100 |
5.2 | GeForce GTX | GTX TITAN X GTX 980 Ti GTX 980 GTX 970 GTX 960 GTX 950 |
Quadro | M6000 24GB M6000 M5000 M5500M M4000 M2200 M2000 M620 |
|
Tesla | M60 M40 |
|
5.0 | GeForce GTX | GTX 750 Ti GTX 750 NVS 810 |
Quadro | K2200 K1200 K620 M1200 M520 M5000M M4000M M3000M M2000M M1000M K620M M600M M500M |
有关在本地构建以支持较旧的 GPU 的信息,请参阅 developer.md
GPU 选择
如果您的系统中有多个 NVIDIA GPU,并且希望限制 Ollama 使用
一个子集,您可以将CUDA_VISIBLE_DEVICES
转换为以逗号分隔的 GPU 列表。
可以使用数字 ID,但顺序可能会有所不同,因此 UUID 更可靠。
您可以通过运行nvidia-smi -L
如果您想
忽略 GPU 并强制使用 CPU,使用无效的 GPU ID(例如,“-1”)
Linux 挂起恢复
在 linux 上,在暂停/恢复周期后,有时 Ollama 将无法发现
您的 NVIDIA GPU,并回退到在 CPU 上运行。您可以解决此问题
驱动程序错误sudo rmmod nvidia_uvm &&
sudo modprobe nvidia_uvm
AMD Radeon
Ollama 支持以下 AMD GPU:
Linux 支持
家庭 | 卡和加速器 |
---|---|
AMD Radeon RX | 7900 XTX 7900 XT 7900 GRE 7800 XT 7700 XT 7600 XT 7600 6950 XT 6900 XTX 6900XT 6800 XT 6800 Vega 64 Vega 56 |
AMD Radeon PRO | W7900 W7800 W7700 W7600 W7500 W6900X W6800X Duo W6800X W6800 V620 V420 V340 V320 Vega II Duo Vega II VII SSG |
AMD Instinct | MI300X MI300A MI300 MI250X MI250 MI210 MI200 MI100 MI60 MI50 |
Windows 支持
在 ROCm v6.1 中,Windows 支持以下 GPU。
家庭 | 卡和加速器 |
---|---|
AMD Radeon RX | 7900 XTX 7900 XT 7900 GRE 7800 XT 7700 XT 7600 XT 7600 6950 XT 6900 XTX 6900XT 6800 XT 6800 |
AMD Radeon PRO | W7900 W7800 W7700 W7600 W7500 W6900X W6800X Duo W6800X W6800 V620 |
Linux 上的覆盖
Ollama 利用 AMD ROCm 库,该库并不支持所有 AMD GPU。在
在某些情况下,您可以强制系统尝试使用类似的 LLVM 目标,即
关闭。例如,Radeon RX 5400 是gfx1034
(也称为 10.3.4)
但是,ROCm 目前不支持此目标。最近的支持是gfx1030
.您可以使用环境变量HSA_OVERRIDE_GFX_VERSION
跟x.y.z
语法。因此,例如,要强制系统在 RX 5400 上运行,您需要
将设置HSA_OVERRIDE_GFX_VERSION="10.3.0"
作为
服务器。如果您有不受支持的 AMD GPU,则可以使用
支持的类型如下。
如果您有多个具有不同 GFX 版本的 GPU,请附加数字设备
number 添加到环境变量中以单独设置它们。例如HSA_OVERRIDE_GFX_VERSION_0=10.3.0
和HSA_OVERRIDE_GFX_VERSION_1=11.0.0
目前,Linux 上已知支持的 GPU 类型是以下 LLVM 目标。 下表显示了映射到这些 LLVM 目标的一些示例 GPU: |LLVM 目标 |GPU 示例 | |-----------------|---------------------| |GFX900 系列 |Radeon RX 维加 56 | |GFX906 |Radeon Instinct MI50 显卡 | |GFX908 |Radeon Instinct MI100 显卡 | |GFX90A |Radeon 本能 MI210 | |GFX940 |Radeon Instinct MI300 显卡 | |GFX941 | | |GFX942 | | |GFX1030 系列 |Radeon PRO V620 显卡 | |GFX1100 |Radeon PRO W7900 显卡 | |GFX1101 |Radeon PRO W7700 显卡 | |GFX1102 |Radeon RX 7600 显卡 |
AMD 正在努力增强 ROCm v6,以扩大对 GPU 系列的支持 未来的版本,这应该会增加对更多 GPU 的支持。
GPU 选择
如果您的系统中有多个 AMD GPU,并且希望限制 Ollama 使用
subset,您可以将ROCR_VISIBLE_DEVICES
转换为以逗号分隔的 GPU 列表。
您可以查看设备列表rocminfo
.如果要忽略 GPU
并强制使用 CPU 时,请使用无效的 GPU ID(例如,“-1”)。如果可用,请使用Uuid
来唯一标识设备,而不是数值。
容器权限
在某些 Linux 发行版中,SELinux 可以防止容器
访问 AMD GPU 设备。在主机系统上,您可以运行sudo setsebool container_use_devices=1
以允许容器使用设备。
Metal (Apple GPU)
Ollama 通过 Metal API 在 Apple 设备上支持 GPU 加速。