当前位置：网站首页 > 智能化工程正文智能化工程

笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

frank 2024-11-29 23:16:04 智能化工程 309 ℃ 0 评论

软硬件：win11,NVIDIA GeForce RTX 3050 显存4g

一.ollama模型最低要求

1. Llama 3.1 (8B) 模型

GPU: 至少需要 1 张具有 16 GB 显存的 GPU（例如 NVIDIA Tesla V100 或 A100）。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD Ryzen）。
内存: 最少 32 GB 的系统内存。
存储: 需要大约 4.7 GB 的存储空间用于模型文件。

2. Llama 3.1 (70B) 模型

GPU: 至少需要 4 张具有 40 GB 或更高显存的 GPU（例如 NVIDIA A100 或 H100）。可以采用分布式计算方式来处理。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD EPYC），推荐使用多台服务器。
内存: 至少 256 GB 的系统内存。
存储: 需要大约 96 GB 的存储空间用于模型文件，建议使用高速 SSD。

3. Llama 3.1 (405B) 模型

GPU: 需要大规模的 GPU 集群，通常包括数十张具有 80 GB 或更多显存的 GPU（例如 NVIDIA A100 或 H100）。需要专门的硬件配置和高性能计算设施。
CPU: 高性能的多核处理器（例如 Intel Xeon 或 AMD EPYC），并且需要多个处理节点来支持分布式计算。
内存: 至少 1 TB 或更多的系统内存。
存储: 需要几百 GB 到 TB 级别的存储空间，建议使用高速 SSD 或分布式存储系统。

对于我们普通人的电脑，ollama模型的部署，你至少拥有一张有显存的n系显卡，再者就是电脑内存一定要在16g及以上

我的硬件信息，有两张8g的内存，一张英伟达显存为4g的3050显卡

查看内存信息：wmic memorychip get capacity, devicelocator, manufacturer, memorytype, speed
查看GPU的信息：nvidia-smi

二.cuda和cudnn的安装(解决显存不足的办法）

CUDA Unified Memory: CUDA 提供了统一内存（Unified Memory），允许 GPU 和 CPU 共享内存空间。这可以使得内存需求超出 GPU 显存时，数据可以存储在主机内存中并在需要时传输到 GPU。

1.cuda的选择与安装

1.打开NVIDIA控制面板>>>系统信息>>>组件

就这个：

可以看到我的是nvduda64.dll NVIDIA cuda 12.6.41 driver

2.进官网，选择相应的cuda,选择版本应该=<自己的版本NVIDIA cuda 12.6.41 driver：CUDA Toolkit Archive | NVIDIA Developer

3.选择本地exe安装

4.双击安装包，自定义设置，勾选组件：

继续点下一步

点击关闭，安装结束

验证：cmd输入

最高版本：nvidia-smi
当前版本：nvcc --version

结果：

2.cudnn的安装
网址：https://developer.nvidia.com/cudnn-downloads?target_os=Windows

多版本：cuDNN Archive | NVIDIA Developer

下载的是一个压缩包，解压至你想保存的位置，并将解压的目录中的bin目录添加到环境变量里的系统变量path里面

这是我解压的bin文件夹位置：

D:\app\cudnn\bin

验证是否成功：

找到你的这个目录，并将下面的变量添加到环境变量里的系统变量path里面

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\demo_suite

打开cmd，分别输入

bandwidthTest.exe 
和
deviceQuery.exe

结果：

三.安装ollama

官网：Ollama

双击安装，默认会安到c盘，好像也没法改,但是看了一下也不是很大，大的是模型，待会会说怎么改模型的存储位置，install，等安装完：

它会自动启动

打开cmd,不用配置path啥的，输入下面两个代码看一下结果：

ollama

ollama list

OK啦

四.模型的选择和默认模型存储位置的更改

ollama官方提供的模型：llama3.1

小黄脸hugging face的模型（模型社区），有别人训练好的模型：https://huggingface.co/

模型的选择

1.更改模型下载位置

创建一个想要你想要保存模型的位置

添加系统环境变量

变量名：OLLAMA_MODELS

变量值：D:\app\OLLAMA_MODELS

2.ollama的模型下载

8b模型是我们目前能运行的最大模型

复制指令，cmd中输入，等下载完

上一步设置无误的话，下载文件会有在你的模型存储位置会有两个这样的文件

下载完后，它自己会启动，试着对话一下，还是很顺畅的

版权说明：如非注明，本站文章均为扬州驻场服务-网络设备调试-监控维修-南京泽同信息科技有限公司原创，转载请注明出处和附带本文链接。

请在这里放置你的在线分享代码

上一篇：【人工智能】模糊逻辑推理-洗衣机模糊推理系统
下一篇：震撼来袭，盘点GitHub上那些免费的神级AI项目，建议立刻收藏！

« 2025年9月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

搜索

最新留言

文章归档

网站收藏

友情链接

笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

软硬件：win11,NVIDIA GeForce RTX 3050 显存4g

一.ollama模型最低要求

1. Llama 3.1 (8B) 模型

2. Llama 3.1 (70B) 模型

3. Llama 3.1 (405B) 模型

对于我们普通人的电脑，ollama模型的部署，你至少拥有一张有显存的n系显卡，再者就是电脑内存一定要在16g及以上

二.cuda和cudnn的安装(解决显存不足的办法）

三.安装ollama

四.模型的选择和默认模型存储位置的更改

1.更改模型下载位置

2.ollama的模型下载

服务项目

联系我们

关于我们

笔记本电脑本地部署ollama大模型（显存不足调用CUDA Unified Memory方法）

软硬件：win11,NVIDIA GeForce RTX 3050 显存4g

一.ollama模型最低要求

1. Llama 3.1 (8B) 模型

2. Llama 3.1 (70B) 模型

3. Llama 3.1 (405B) 模型

对于我们普通人的电脑，ollama模型的部署，你至少拥有一张有显存的n系显卡，再者就是电脑内存一定要在16g及以上

二.cuda和cudnn的安装(解决显存不足的办法）

三.安装ollama

四.模型的选择和默认模型存储位置的更改

1.更改模型下载位置

2.ollama的模型下载

相关文章推荐

服务项目

联系我们

关于我们