基于Flexus云服务器X实例体验大模型部署体验测评

摘要：当下，各种大模型层出不穷，先有openai的chatgpt，后有百度文心一言，再就是国内大模型齐头并进的抢先发布。

@TOC

前言

当下，各种大模型层出不穷，先有openai的chatgpt，后有百度文心一言，再就是国内大模型齐头并进的抢先发布。

让普通的开发者不必为不能体验chatgpt而担忧，国内的大模型速度也很快。但是大家目前都是在体验，能不能部署一下试试呢？

今天，我们就以华为云Flexus云服务器X实例来部署一下，顺便测测其性能看看。

在华为云828 B2B企业节狂潮中，Flexus X实例的限时大促销震撼来袭，绝对是你不容错过的超级福利！对于那些追求极致算力、对自建MySQL、Redis、Nginx性能有着苛刻要求的技术极客们，这次活动无疑是你们的专属盛宴！赶紧抓住这个千载难逢的机会，让业务效能飞跃升级！！！

注意：本文为高端局，对于还不知道怎么使用shell工具，不知道云服务器为何物？不知道大模型为何物的读者可以退出啦，本文不太适合

部署千问大模型

之前一直就想搞个大模型玩玩了，奈何电脑配置不打够，所以只能是可望而不可及，今天，就单独用这款华为云Flexus云服务器X实例来试试。

本文我们基于Ollama部署和运行大模型，那么，何为Ollama？

官网：在这里

不过官网上都是洋文，看着比较吃力。我搜了些资料，给大家现个丑：

Ollama 是一个强大的框架，设计用于在 Docker 容器中部署 LLM。Ollama 的主要功能是在 Docker 容器内部署和管理 LLM 的促进者，它使该过程变得非常简单。它帮助用户快速在本地运行大模型，通过简单的安装指令，可以让用户执行一条命令就在本地运行开源大型语言模型，例如 Llama 2。来源：这里

下面，我们来开始实操！

下载Ollama用于启动并运行大模型,手动下载ollma，下载地址如下所示：

curl -fsSL https://ollama.com/install.sh | sh

我们可以直接从浏览器中输入，然后会自动下载，当然，我们也可以直接从shell工具中下载，不过就是有点慢，他这个东西还很大。

等待的过程挺漫长，可以先去找点别的事儿去做。