Ollama

关注公众号 jb51net

关闭
AI > Ollama >

在本地部署大模型ollama的保姆级教程

Alson_Code

一、部署方式选择

部署方式上手难度核心特点适用场景
Ollama命令极简,自动适配环境,自带 API 接口新手日常本地调用、快速测试
LM Studio图形化操作,无需敲代码,兼容 OpenAI 接口不想使用命令行、纯可视化使用
Text Generation WebUI⭐⭐⭐功能齐全,支持模型微调、多种量化格式深度调试模型、个性化参数配置
vLLM⭐⭐⭐⭐推理速度快,高并发性能强搭建对外服务、生产环境部署

大家可以按需自我选择,我的推荐是本地自己玩使用ollama,在企业使用最好用vLLM

二、ollama下载(windows电脑为例)

如果官网能下载就用官网,不能就镜像地址,懂得都懂

  1. 官网地址:https://ollama.com/download
  2. 镜像地址:https://cnb.cool/hex/ollama/-/releases/latest/download/OllamaSetup.exe

注意:后续下载模型一般都好几个G,可以在setting中设置模型下载地址

三、免费开源大模型选择

模型名称推荐版本中文友好商用权限Ollama 下载命令最低显存推荐显存最低内存推荐内存硬件适配选型
通义千问 QwenQwen2:7b/14b★★★★★免费可商用ollama run qwen2:7b
ollama run qwen2:14b
6G
10G
8-16G
16G+
16G
32G
32G
64G
16G 内存选 7b,32G 及以上内存选 14b
智谱 ChatGLMchatglm3:6b★★★★★免费可商用ollama run chatglm3:6b5G6-8G16G32G常规家用内存均可流畅运行
Llama3llama3:8b★★★☆☆个人免费商用受限ollama run llama3:8b6G8-16G16G32G16G 标准内存适配日常使用
DeepSeekdeepseek:7b★★★★☆个人免费商用受限ollama run deepseek:7b6G8-16G16G32G代码推理场景,16G 内存够用
Mixtralmixtral:8x7b★★★☆☆免费可商用ollama run mixtral10G16G+32G64G大内存机型专属,长文本处理优选
Gemmagemma2:9b★★★☆☆个人免费商用受限ollama run gemma2:9b8G12-16G16G32G主流内存配置均可稳定运行
Phi-3phi3:mini★★★☆☆免费可商用ollama run phi3:mini3G4-6G8G16G低配小内存笔记本首选

我是16G内存,下载的是Qwen2:7b,直接在powershell上运行ollama run qwen2:7b

四、使用

选中模型直接对话即可,就可以使用了!!!

地址验证:http://localhost:11434/

五、项目集成(Spring AI框架为例)

  1. pom依赖
<dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
        <!-- Spring AI Ollama 依赖 -->
        <dependency>
            <groupId>org.springframework.ai</groupId>
            <artifactId>spring-ai-starter-model-ollama</artifactId>
            <version>1.0.0</version>
        </dependency>
    </dependencies>
  1. yaml配置
spring:
  application:
    name: spring-ai-demo
  ai:
   ollama:
     base-url: http://localhost:11434
     chat:
       model: qwen2:7b
  1. 测试运行
package com.example.springaidemo.controller;
import org.springframework.ai.chat.client.ChatClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;
@RestController
public class AiController {
    private final ChatClient chatClient;
    // 自动注入 Ollama
    public AiController(ChatClient.Builder chatClientBuilder) {
        this.chatClient = chatClientBuilder.build();
    }
    // 测试接口
    @GetMapping("/ai")
    public String ask(String question) {
        return chatClient.prompt()
                .user(question)
                .call()
                .content();
    }
}

到此这篇关于在本地部署大模型ollama的保姆级教程的文章就介绍到这了,更多相关本地部署大模型ollama内容请搜索脚本之家以前的文章或继续浏览下面的相关文章,希望大家以后多多支持脚本之家!