由于最新的AnythingLLM内置了LLM供应商，所以第一步不是必须，你可以选择跳过。直接到第二部分

第一步：安装ollama

ollama，这玩意儿现在可以说是跑大模型的神器。不管你用的是PC、Mac还是树莓派，只要内存够，跑起来都不是问题。
记得，7B模型至少要8G内存，13B的要16G，想玩70B的大家伙，那得有64G。

首先，去ollama.com下载适合你操作系统的版本，我用的是Windows，下载安装完之后，在命令行敲一下ollama -V，能看到版本号就说明安装好了。

下载适合本地电脑的大模型，ollama网站上有个“Models”链接，点进去找到“gemma”模型。在“Tags”里面找到你想运行的模型版本，比如“7b”，旁边有个复制按钮，点击后把命令复制下来。

然后就是在命令行里跑这个命令，第一次运行会自动下载模型。下载完毕，就能开始和它聊天或者让它帮你写代码了。如下图

使用像 ChatGPT 那样的现代的聊天窗口

虽然部署完成了，但是上面那种古老的终端可能影响我们的交互体验，下面提供聊天窗口工具（如果你不想使用这些GUI，这一步可以跳过，不影响本地知识库搭建，直接去看下面的第二步：AnythingLLM安装）

chatbox

打开设置，模型提供方选 ollama，API 地址是本地的 11434 端口，模型选 gemma:7b。

地址：https://chatboxai.app/zh

第二步：AnythingLLM安装

下载地址：https://useanything.com/download

有Windows的版本，功能会比Linux下的差一点点，不过不影响我们使用和体验。

产品概述

AnythingLLM 是最易于使用的一体化AI 应用程序，可以执行 RAG、AI 代理等，且无需担心代码或基础设施问题。

为什么要使用AnythingLLM？

您需要一个零设置、私有、一体化的 AI 应用程序，用于本地 LLM、RAG 和 AI 代理，并且所有这些都集中在一个地方，而无需开发人员进行痛苦的设置。

更多的资料可以访问官方地址：https://docs.useanything.com/

AnythingLLM 的一些很酷的功能

以下是 AnythingLLM 的一些酷炫功能：

1. 支持多用户实例和权限
2. 新的自定义可嵌入式聊天小部件，可以嵌入到你的网站
3. 支持多种文件类型（PDF，TXT，DOCX等）
4. 通过简单的用户界面管理你的向量数据库中管理文件
5. 提供两种聊天模式：对话和查询。对话保留先前的问题和修订。查询是针对文档的简单QA
6. 聊天过程中的引用
7. 100%适合云部署。
8. “自带LLM”模型
9. 处理大文件时极有效的节约成本措施。你永远不必为将大型文件或记录输送到聊天机器人中支付费用，比其他的文件聊天机器人解决方案节省90%的费用。
10. 提供全面的开发者API用于自定义集成！

同类开源项目大多基于Python语言开发。AnythingLLM采用了Javascript，前端用React，后端用Node，对于全栈工程师非常友好。

• 前端： React和ViteJS，实现创建和管理大模型用到的知识库
• 后端： Node.js Express框架，实现向量数据库的管理和所有与大模型的交互
• 采集器： Node.js Express框架，实现对文档的处理解析

多用户模式

这一点对于企业级应用特别关键，AnythingLLM支持多用户模式，3种角色的权限管理。

系统会默认创建一个管理员（Admin）账号，拥有全部的管理权限。

第二种角色是Manager账号，可管理所有工作区和文档，但是不能管理大模型、嵌入模型和向量数据库。

普通用户账号，则只能基于已授权的工作区与大模型对话，不能对工作区和系统配置做任何更改。

打开ollama端口：

Ollama有两种模式：

1. 聊天模式
2. 服务器模式

这里使用服务器模式，Ollama在后端运行大模型，开发IP和端口给外部软件使用。

ollama serve

通过终端或者命令行，访问 http://localhost:11434 进行验证：

curl http://localhost:11434
下图中，显示ollama已经在运行了。

其实最新版本的AnythingLLM内置了大模型选择，不需要单独安装ollama什么的了。

看配置界面中，可以方便的选择一个

启动并配置AnythingLLM

搭建一个本地知识库，会涉及到三个关键：
1. LLM Model，大语言模型。它负责处理和理解自然语言。
2. Embedding Model，嵌入模型。它负责把高维度的数据转化为低维度的嵌入空间。这个数据处理过程在RAG中非常重要。
3. Vector Store，向量数据库，专门用来高效处理大规模向量数据。

本地大模型选择

选择 Ollama，填入 Ollama 的 http://127.0.0.1:11434 端口，然后选择你下载的模型。