Ollama

本文内容均由Ollama官方文档翻译，仅供个人学习，如有差异请以官网文档为准（https://ollama.com）ollama.cadn.net.cn

快速上手大型语言模型。ollama.cadn.net.cn

macOS

Windows

Linux

curl -fsSL https://ollama.com/install.sh | sh

手动安装说明 ollama.cadn.net.cn

Docker

官方的 Ollama Docker 镜像 ollama/ollama 已在 Docker Hub 上提供。ollama.cadn.net.cn

库

社区

快速入门

要运行并聊天使用 Llama 3.2：ollama.cadn.net.cn

ollama run llama3.2

模型库

Ollama 支持 ollama.com/library 上提供的模型列表ollama.cadn.net.cn

以下是一些可下载的示例模型：ollama.cadn.net.cn

模型	参数	大小	下载
DeepSeek-R1	7B	4.7GB	`ollama run deepseek-r1`
DeepSeek-R1	671B	404GB	`ollama run deepseek-r1:671b`
Llama 3.3	70B	43GB	`ollama run llama3.3`
Llama 3.2	3B	2.0GB	`ollama run llama3.2`
Llama 3.2	1B	1.3GB	`ollama run llama3.2:1b`
Llama 3.2 Vision	11B	7.9GB	`ollama run llama3.2-vision`
Llama 3.2 Vision	90B	55GB	`ollama run llama3.2-vision:90b`
Llama 3.1	8B	4.7GB	`ollama run llama3.1`
Llama 3.1	405B	231GB	`ollama run llama3.1:405b`
Phi 4	14B	9.1GB	`ollama run phi4`
Phi 3 Mini	3.8B	2.3GB	`ollama run phi3`
Gemma 2	2B	1.6GB	`ollama run gemma2:2b`
Gemma 2	9B	5.5GB	`ollama run gemma2`
Gemma 2	27B	16GB	`ollama run gemma2:27b`
Mistral	7B	4.1GB	`ollama run mistral`
Moondream 2	1.4B	829MB	`ollama run moondream`
Neural Chat	7B	4.1GB	`ollama run neural-chat`
Starling	7B	4.1GB	`ollama run starling-lm`
Code Llama	7B	3.8GB	`ollama run codellama`
Llama 2 无限制版	7B	3.8GB	`ollama run llama2-uncensored`
LLaVA	7B	4.5GB	`ollama run llava`
Solar	10.7B	6.1GB	`ollama run solar`

[!NOTE] 运行7B模型至少需要8 GB的RAM，运行13B模型需要16 GB，运行33B模型则需要32 GB。ollama.cadn.net.cn

自定义模型

从 GGUF 导入

Ollama 支持在 Modelfile 中导入 GGUF 模型：ollama.cadn.net.cn

创建一个名为 Modelfile 的文件，其中包含一条 FROM 指令，用于指定要导入的模型的本地文件路径。ollama.cadn.net.cn
```
FROM ./vicuna-33b.Q4_0.gguf
```
在 Ollama 中创建模型ollama.cadn.net.cn
```
ollama create example -f Modelfile
```
运行模型ollama.cadn.net.cn
```
ollama run example
```

从 Safetensors 导入

请参阅指南，了解有关导入模型的更多信息。ollama.cadn.net.cn

自定义提示

来自 Ollama 库的模型可通过提示（prompt）进行自定义。例如，要自定义 llama3.2 模型：ollama.cadn.net.cn

ollama pull llama3.2

创建一个 Modelfile：ollama.cadn.net.cn

FROM llama3.2

# set the temperature to 1 [higher is more creative, lower is more coherent]
PARAMETER temperature 1

# set the system message
SYSTEM """
You are Mario from Super Mario Bros. Answer as Mario, the assistant, only.
"""

接下来，创建并运行模型：ollama.cadn.net.cn

ollama create mario -f ./Modelfile
ollama run mario
>>> hi
Hello! It's your friend Mario.

有关使用 Modelfile 的更多信息，请参阅 Modelfile 文档。ollama.cadn.net.cn

CLI 参考文档

创建模型

ollama create 用于根据 Modelfile 创建模型。ollama.cadn.net.cn

ollama create mymodel -f ./Modelfile

拉取模型

ollama pull llama3.2

此命令也可用于更新本地模型。仅会拉取差异部分。ollama.cadn.net.cn

删除模型

ollama rm llama3.2

复制模型

ollama cp llama3.2 my-model

多行输入

对于多行输入，您可以使用 """ 包裹文本：ollama.cadn.net.cn

>>> """Hello,
... world!
... """
I'm a basic program that prints the famous "Hello, world!" message to the console.

多模态模型

ollama run llava "What's in this image? /Users/jmorgan/Desktop/smile.png"

输出：该图像包含一个黄色笑脸，很可能是图片的中心焦点。ollama.cadn.net.cn

将提示作为参数传递

ollama run llama3.2 "Summarize this file: $(cat README.md)"

输出： Ollama 是一个轻量级、可扩展的框架，用于在本地机器上构建和运行语言模型。它提供了一个简单的 API，用于创建、运行和管理模型，同时还提供了一个预构建模型库，可轻松应用于各种场景。ollama.cadn.net.cn

显示模型信息

ollama show llama3.2

列出您计算机上的模型

ollama list

列出当前已加载的模型

ollama ps

停止当前正在运行的模型

ollama stop llama3.2

启动 Ollama

ollama serve 用于在不启动桌面应用程序的情况下启动 ollama。ollama.cadn.net.cn

构建

请参阅开发者指南 ollama.cadn.net.cn

运行本地构建

接下来，启动服务器：ollama.cadn.net.cn

./ollama serve

最后，在一个独立的终端中运行一个模型：ollama.cadn.net.cn

./ollama run llama3.2

REST API

Ollama 提供了用于运行和管理模型的 REST API。ollama.cadn.net.cn

生成响应

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2",
  "prompt":"Why is the sky blue?"
}'

与模型对话

curl http://localhost:11434/api/chat -d '{
  "model": "llama3.2",
  "messages": [
    { "role": "user", "content": "why is the sky blue?" }
  ]
}'

查看 API 文档以获取所有端点。ollama.cadn.net.cn

社区集成

Web 和桌面应用

Open WebUI
Enchanted (macOS native)
Hollama
Lollms-Webui
LibreChat
Bionic GPT
HTML UI
Saddle
聊天机器人界面
聊天机器人界面 v2
TypeScript 用户界面
适用于 Ollama 模型的极简 React UI
Ollamac
big-AGI
切萨雷猫（Cheshire Cat）助手框架
Amica
chatd
Ollama-SwiftUI
Dify.AI
MindMac
Ollama 的 NextJS Web 界面
Msty
聊天框
WinForm Ollama Copilot
NextChat 与入门指南文档
Alpaca WebUI
OllamaGUI
OpenAOE
Odin Runes
LLM-X（渐进式 Web 应用）
AnythingLLM（Docker + MacOs/Windows/Linux 原生应用）
Ollama 基础聊天：采用 HyperDiv 响应式 UI
Ollama-chats RPG
IntelliBar（面向 macOS 的 AI 驱动型助手）
QA-Pilot（交互式聊天工具，可利用 Ollama 模型快速理解并导航 GitHub 代码仓库）
ChatOllama（基于 Ollama 的开源聊天机器人，具备知识库功能）
CRAG Ollama 聊天（带纠正性 RAG 的简单网页搜索）
RAGFlow（基于深度文档理解的开源检索增强生成引擎）
StreamDeploy（LLM 应用程序脚手架）
聊天（团队用聊天网页应用）
Lobe Chat 与集成文档
Ollama RAG 聊天机器人（使用 Ollama 和 RAG 技术进行本地多 PDF 聊天）
BrainSoup（支持RAG与多智能体自动化的灵活原生客户端）
macai（用于 Ollama、ChatGPT 及其他兼容 API 后端的 macOS 客户端）
RWKV-Runner（RWKV 离线大语言模型部署工具，也可用作 ChatGPT 和 Ollama 的客户端）
Ollama 网格搜索（用于评估和比较模型的应用程序）
Olpaka（面向 Ollama 的用户友好型 Flutter Web 应用程序）
OllamaSpring（macOS 平台的 Ollama 客户端）
LLocal.in（用于 Ollama 的易用型 Electron 桌面客户端）
Shinkai Desktop（通过 Ollama + 文件 + RAG 实现本地 AI 的双击安装）
AiLama（一个Discord用户应用程序，可让您在Discord的任何位置与Ollama进行交互）
使用 Google Mesop 的 Ollama（基于 Ollama 的 Mesop 聊天客户端实现）
R2R（开源 RAG 引擎）
Ollama-Kis（一个简单易用的图形界面，包含供驾驶员培训使用的示例自定义大语言模型）
OpenGPA（开源、离线优先的企业级智能体应用）
Painting Droid（集成AI功能的绘画应用）
Kerlig AI（适用于 macOS 的 AI 写作助手）
AI 工作室
Sidellama（基于浏览器的 LLM 客户端）
LLMStack（无需编码的多智能体框架，用于构建大语言模型智能体与工作流）
BoltAI for Mac（Mac 平台 AI 聊天客户端）
Harbor（基于 Ollama 作为默认后端的容器化大语言模型工具包）
PyGPT（面向 Linux、Windows 和 Mac 的 AI 桌面助手）
Alpaca（一个使用 GTK4 和 Adwaita 开发的适用于 Linux 和 macOS 的 Ollama 客户端应用程序）
AutoGPT（AutoGPT 与 Ollama 集成）
Go-CREW（Golang 实现的高性能离线 RAG）
PartCAD（基于 OpenSCAD 和 CadQuery 的 CAD 模型生成工具）
Ollama4j Web UI - 基于 Java 的 Ollama Web 界面，采用 Vaadin、Spring Boot 和 Ollama4j 构建
PyOllaMx - 一款可在 macOS 上与 Ollama 和 Apple MLX 模型进行聊天的应用程序。
Claude Dev - 用于多文件/整个代码仓库编程的 VSCode 扩展
Cherry Studio（支持 Ollama 的桌面客户端）
ConfiChat （轻量级、独立运行、多平台支持、注重隐私的 LLM 聊天界面，支持可选加密功能）
Archyve（支持RAG的文档库）
使用 Mesop 运行 crewAI（基于 Mesop Web 界面，结合 Ollama 运行 crewAI）
基于 Tkinter 的客户端（用于 Ollama 的 Python Tkinter 客户端）
LLMChat（注重隐私，100%本地运行，直观的一体化聊天界面）
本地多模态AI聊天（基于Ollama的LLM聊天，支持多种功能，包括PDF RAG、语音聊天、图像交互以及与OpenAI的集成。）
ARGO（在 Mac/Windows/Linux 上本地下载并运行 Ollama 和 Huggingface 模型，并支持 RAG 功能）
OrionChat - OrionChat 是一个用于与不同 AI 提供商进行聊天的网页界面
G1（使用提示策略改进大型语言模型推理能力的原型，采用类似 o1 的推理链方法。）
Web 管理（Web 管理页面）
Promptery（Ollama 的桌面客户端。）
Ollama 应用（现代化且易于使用的多平台 Ollama 客户端）
chat-ollama（一个用于 Ollama 的 React Native 客户端）
SpaceLlama（用于在侧边栏中快速使用 ollama 摘要网页的 Firefox 和 Chrome 扩展）
YouLama（用于快速总结任何 YouTube 视频的 Web 应用，同时支持 Invidious）
DualMind（实验性应用，允许两个模型在终端或Web界面中相互交流）
ollamarama-matrix（用于 Matrix 聊天协议的 Ollama 聊天机器人）
ollama-chat-app（基于 Flutter 的聊天应用）
Perfect Memory AI（生产力类人工智能助手，根据您在会议中看到、听到和说出的内容为您提供个性化服务）
Hexabot（一个对话式 AI 构建平台）
Reddit Rate（通过加权求和搜索并评分Reddit主题）
OpenTalkGpt（一款 Chrome 扩展程序，用于管理 Ollama 支持的开源模型、创建自定义模型，并通过用户友好的界面与模型进行对话）
VT（一个最小化的多模态AI聊天应用，支持动态对话路由。可通过 Ollama 支持本地模型）
Nosia（基于 Ollama 的简易安装与使用 RAG 平台）
Witsy（一款支持 Mac/Windows/Linux 的人工智能桌面应用程序）
Abbey（一个可配置的AI接口服务器，支持笔记本、文档存储和YouTube）
Minima（基于本地部署或完全本地化工作流的RAG）
aidful-ollama-model-delete（用于简化模型清理的用户界面）
Perplexica（一个由人工智能驱动的搜索引擎，也是 Perplexity AI 的开源替代方案）
Ollama 聊天 WebUI（适用于 Docker）（支持本地 Docker 部署，轻量级 Ollama WebUI）
适用于 Visual Studio Code 的 AI 工具包（微软官方 VSCode 扩展，支持与 Ollama 集成进行模型对话、测试与评估，并可在您的 AI 应用中加以使用。）
MinimalNextOllamaChat（用于聊天和模型控制的极简 Web 界面）
Chipper 面向极客的 AI 界面（支持 Ollama、Haystack RAG 和 Python）
ChibiChat（基于 Kotlin 的 Android 应用，用于与 Ollama 和 Koboldcpp API 端点进行聊天）
LocalLLM（一个轻量级 Web 应用，可通过图形界面运行 ollama 模型）
Ollamazing（用于运行 Ollama 模型的 Web 扩展）

云服务

终端

oterm
Ellama Emacs 客户端
Emacs 客户端
neollama 用于在 Neovim 内与模型进行交互的 UI 客户端
gen.nvim
ollama.nvim
ollero.nvim
ollama-chat.nvim
ogpt.nvim
gptel Emacs 客户端
燕麦
cmdh
ooo
shell-pilot（通过纯 shell 脚本在 Linux 或 macOS 上与模型交互）
tenere
llm-ollama 适用于 Datasette 的 LLM 命令行工具。
typechat-cli
ShellOracle
tlm
podman-ollama
gollama
ParLlama
Ollama 电子书摘要
50 行代码实现 Ollama 混合专家（MOE）
vim-intelligence-bridge Vim 编辑器与 "Ollama" 的简单交互
x-cmd ollama
bb7
SwollamaCLI，随 Swollama Swift 包一同提供。演示
aichat 一体化的 LLM 命令行工具，具备 Shell 助手、Chat-REPL、RAG、AI 工具与智能体功能，并支持访问 OpenAI、Claude、Gemini、Ollama、Groq 等多种服务。
PowershAI PowerShell 模块，将 AI 能力引入 Windows 终端，支持 Ollama
orbiton 无需配置的文本编辑器和集成开发环境（IDE），支持使用 Ollama 的 Tab 键补全功能。

Apple Vision Pro

Enchanted

数据库

pgai - 将 PostgreSQL 用作向量数据库（通过 pgvector 从 Ollama 模型创建和搜索嵌入向量）
- 入门指南
MindsDB（将 Ollama 模型与近 200 个数据平台和应用程序连接）
chromem-go 与示例
Kangaroo（基于人工智能的SQL客户端及主流数据库的管理工具）

包管理器

库

LangChain 和 LangChain.js 配合示例
Firebase Genkit
crewAI
Yacana（面向思维碰撞与执行预设流程的用户友好型多智能体框架，内置工具集成）
Spring AI 附带参考文档和示例
LangChainGo 与示例
LangChain4j 与示例
LangChainRust 与示例
LangChain for .NET 与示例
LLPhant
LlamaIndex 和 LlamaIndexTS
LiteLLM
OllamaFarm for Go
OllamaSharp for .NET
Ollama for Ruby
Ollama-rs for Rust
Ollama-hpp for C++
Ollama4j for Java
ModelFusion TypeScript 库
OllamaKit for Swift
适用于 Dart 的 Ollama
Ollama for Laravel
LangChainDart
语义内核 - Python
Haystack
Elixir LangChain
Ollama for R - rollama
R 语言的 Ollama - ollama-r
Ollama-ex for Elixir
SAP ABAP 的 Ollama 连接器
Testcontainers
Portkey
PromptingTools.jl 与一个示例
LlamaScript
llm-axe（用于构建基于大语言模型（LLM）应用的 Python 工具包）
Gollm
Gollama for Golang
Golang 的 Ollama 客户端
Go 语言中的高级函数抽象
Ollama PHP
Agents-Flex for Java with 示例
Parakeet 是一个 GoLang 库，旨在简化使用 Ollama 开发小型生成式 AI 应用程序的过程。
Haverscript 与示例
Ollama for Swift
Swollama for Swift 与 DocC
GoLamify
Ollama for Haskell
multi-llm-ts（一个 TypeScript/JavaScript 库，支持通过统一 API 访问多种大语言模型）
LlmTornado（一个用C#编写的库，为主流开源（FOSS）及商业推理API提供统一接口）
Zig 的 Ollama
Abso（与 OpenAI 兼容的 TypeScript SDK，支持任意 LLM 提供商）

移动版

Enchanted
家政服务人员
Ollama 应用（现代化且易于使用的多平台 Ollama 客户端）
ConfiChat （轻量级、独立运行、多平台支持、注重隐私的 LLM 聊天界面，支持可选加密功能）

扩展与插件

Raycast 扩展
Discollama（Ollama Discord 频道内的 Discord 机器人）
Continue
Vibe（使用 Ollama 进行会议语音转写与分析）
Obsidian Ollama 插件
Logseq Ollama 插件
NotesOllama（Apple Notes Ollama 插件）
Dagger Chatbot
Discord AI 机器人
Ollama Telegram 机器人
Hass Ollama 会话
Rivet 插件
Obsidian BMO 聊天机器人插件
Cliobot（支持 Ollama 的 Telegram 机器人）
Obsidian 插件的 Copilot
Obsidian 本地 GPT 插件
Open Interpreter
Llama Coder（基于 Ollama 的 Copilot 替代方案）
Ollama Copilot（代理工具，可让您将 Ollama 用作类似于 GitHub Copilot 的协作者）
twinny（基于 Ollama 的 Copilot 和 Copilot 聊天替代方案）
Wingman-AI（基于 Ollama 和 Hugging Face 的 Copilot 代码与聊天替代方案）
Page Assist（Chrome 扩展程序）
Plasmoid Ollama 控制（KDE Plasma 扩展，可让您快速管理/控制 Ollama 模型）
AI Telegram 机器人（后端使用 Ollama 的 Telegram 机器人）
AI ST Completion（支持 Ollama 的 Sublime Text 4 AI 助手插件）
Discord-Ollama 聊天机器人（通用 TypeScript Discord 机器人，附调优文档）
ChatGPTBox：一站式浏览器扩展插件，附集成教程
Discord AI 聊天/审核机器人用 Python 编写的聊天/审核机器人，利用 Ollama 创建个性。
无头 Ollama（用于在任何操作系统上自动安装 Ollama 客户端及模型的脚本，适用于依赖 Ollama 服务器的应用）
Terraform AWS Ollama & Open WebUI（一个 Terraform 模块，用于在 AWS 上部署开箱即用的 Ollama 服务及其前端 Open WebUI 服务。）
node-red-contrib-ollama
本地 AI 助手（适用于 Chrome 和 Firefox 的扩展程序，可实现与当前活动标签页的交互，并支持自定义 API 端点。包含用户提示的安全存储功能。）
vnc-lm（通过 Ollama 和 LiteLLM 实现与大语言模型（LLM）消息交互的 Discord 机器人。可在本地模型与旗舰模型之间无缝切换。）
LSP-AI（用于人工智能功能的开源语言服务器）
QodeAssist（Qt Creator 的 AI 驱动编码助手插件）
Obsidian 问卷生成器插件
AI 摘要助手插件
TextCraft（基于 Ollama 的 Word 中 Copilot 替代方案）
Alfred Ollama（Alfred 工作流）
TextLLaMA 一款 Chrome 扩展程序，可帮助您撰写邮件、修正语法，并支持将文本翻译成任意语言
Simple-Discord-AI

支持的后端

llama.cpp 项目由 Georgi Gerganov 创立。

可观测性

Lunary 是领先的开源大语言模型（LLM）可观测性平台。它提供了一系列企业级功能，包括实时分析、提示词模板管理、个人身份信息（PII）脱敏以及全面的智能体（Agent）追踪。
OpenLIT 是一款原生支持 OpenTelemetry 的工具，用于通过追踪和指标监控 Ollama 应用程序及 GPU。
HoneyHive 是一个面向 AI 代理的可观测性与评估平台。使用 HoneyHive 可评估代理性能、分析失败原因，并监控生产环境中的质量表现。
Langfuse 是一个开源的 LLM（大语言模型）可观测性平台，使团队能够协作监控、评估和调试 AI 应用程序。
MLflow Tracing 是一个开源的 LLM 观测工具，提供便捷的 API 用于记录和可视化追踪数据，便于调试和评估生成式 AI 应用。