如何在本地安装 DeepSeek Janus Pro 7B?

2025-05-27

如何在本地安装 DeepSeek Janus Pro 7B?

图片描述

Janus-Pro 构建于 DeepSeek-LLM-7B 基础上,是一个先进的多模态框架,旨在统一理解和生成任务。通过将视觉编码解耦为独立的路径,同时保持统一的 Transformer 架构,Janus-Pro 解决了视觉理解和生成之间的冲突。Janus-Pro 配备了用于图像输入的 SigLIP-L 视觉编码器和用于图像生成的高效分词器,在多模态基准测试中表现出色,超越了统一模型,并与特定任务方法相媲美。其简洁性、灵活性和强大的设计使其成为下一代视觉语言模型的有力竞争者。

图片描述

资源

拥抱脸

链接:https ://huggingface.co/deepseek-ai/Janus-Pro-7B

GitHub

链接: https: //github.com/deepseek-ai/Janus

本地安装 DeepSeek Janus Pro 7B 的先决条件
确保您具备以下条件:

GPU:1xRTXA6000(用于流畅执行)。
磁盘空间:100 GB 可用。RAM
:64 GB(48 GB 也可以),但我们使用 64 GB 以确保流畅执行。CPU
:64 核(48 GB 也可以),但我们使用 64 GB 以确保流畅执行。
本地安装 NVIDIA SANA 模型的分步过程。
在本教程中,我们将使用 NodeShift 提供的 GPU 驱动的虚拟机;但是,您可以使用您选择的任何其他云提供商复制相同的步骤。NodeShift 提供最经济实惠的虚拟机,其规模符合 GDPR、SOC2 和 ISO27001 的要求。

步骤 1:注册并设置 NodeShift 云帐户

访问NodeShift 平台并创建帐户。注册后,登录您的帐户。

按照帐户​​设置流程并提供必要的详细信息。

图片描述

步骤2:创建GPU节点(虚拟机)

GPU 节点是 NodeShift 的 GPU 虚拟机,是一种按需资源,配备了从 H100 到 A100 的各种 GPU。这些 GPU 驱动的虚拟机提供增强的环境控制,允许根据特定需求调整 GPU、CPU、RAM 和存储的配置。

图片描述

导航到左侧菜单。选择“GPU 节点”选项,在仪表板中创建一个 GPU 节点,单击“创建 GPU 节点”按钮,然后创建您的第一个虚拟机部署。

图片描述

步骤 3:选择型号、区域和存储

在“GPU 节点”选项卡中,根据您的需求和想要启动模型的地理区域选择 GPU 模型和存储。

图片描述

本教程将使用 1 个 RTX A6000 GPU 来实现最快的性能。不过,如果您的需求更合适,也可以选择价格更实惠、显存更少的 GPU。

步骤4:选择身份验证方法

有两种身份验证方法可用:密码和 SSH 密钥。SSH 密钥是更安全的选择。要创建密钥,请参阅我们的官方文档

图片描述

步骤5:选择图像

接下来,您需要为您的虚拟机选择一个镜像。我们将在 NVIDIA Cuda 虚拟机上部署 DeepSeek Janus Pro 7B。这个专有的闭源并行计算平台允许您在 GPU 节点上安装 DeepSeek Janus Pro 7B。

图片描述

选择图像后,单击“创建”按钮,您的虚拟机将被部署。

图片描述

步骤6:虚拟机成功部署

您将获得节点已启动并正在运行的视觉确认。

图片描述

步骤 7:使用 SSH 连接到 GPU

NodeShift GPU 可以使用 GPU 创建期间提供的 SSH 密钥连接到终端并通过终端进行控制。

成功创建 GPU 节点部署并达到“正在运行”状态后,您可以导航到 GPU 部署实例页面。然后点击右上角的“连接”按钮。

图片描述

图片描述

现在打开您的终端并粘贴代理 SSH IP 或直接 SSH IP。

图片描述

接下来,如果您想检查 GPU 详细信息,请运行以下命令:

nvidia-smi

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤 8:检查可用的 Python 版本并安装新版本

运行以下命令检查可用的 Python 版本。

如果你检查 Python 版本,系统默认安装的是 Python 3.8.1。要安装更高版本的 Python,你需要使用 deadsnakes PPA。

运行以下命令添加 deadsnakes PPA:

sudo apt update
sudo apt install -y software-properties-common
sudo add-apt-repository -y ppa:deadsnakes/ppa
sudo apt update

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤9:安装Python 3.11

现在,运行以下命令来安装 Python 3.11 或其他所需版本:

sudo apt install -y python3.11 python3.11-distutils python3.11-venv

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤10:更新默​​认Python3版本

现在,运行以下命令将新的 Python 版本链接为默认的 python3:

sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.8 1
sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.11 2
sudo update-alternatives --config python3

Enter fullscreen mode Exit fullscreen mode

然后,运行以下命令来验证新的 Python 版本是否处于活动状态:

python3 --version

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤11:安装并更新Pip

运行以下命令来安装和更新pip:

python3 -m ensurepip --upgrade
python3 -m pip install --upgrade pip

Enter fullscreen mode Exit fullscreen mode

然后运行以下命令检查pip的版本:

pip --version

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤12:克隆存储库

运行以下命令克隆 DeepSeek Janus 存储库:

git clone https://github.com/deepseek-ai/Janus.git
cd Janus

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤13:安装项目依赖项

运行以下命令安装项目依赖项:

pip install -e .

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤14:安装Gradio

运行以下命令安装 gradio:

pip install -e .[gradio]

Enter fullscreen mode Exit fullscreen mode

图片描述

步骤15:运行服务器

执行以下命令运行服务器:

python3 demo/app_januspro.py

Enter fullscreen mode Exit fullscreen mode

图片描述

图片描述

步骤16:访问应用程序

通过以下方式访问应用程序:

在本地 URL 上运行:http://127.0.0.1: 7860

在公共 URL 上运行:https://0fac078df655921b11.gradio.live

图片描述

步骤17:多模态理解

图片描述

图片描述

步骤18:文本到图像生成

图片描述

图片描述

图片描述

结论

总而言之,DeepSeek Janus Pro 7B 是一个突破性的多模态框架,旨在统一和优化涉及多模态理解和文本转图像生成的任务。通过利用其解耦的视觉编码和统一的 Transformer 架构,它超越了传统的统一模型,同时保持了各种应用所需的灵活性和简便性。Janus Pro 拥有详细的安装指南,并与先进的 GPU 配置兼容,非常适合致力于探索多模态能力下一个前沿领域的研究人员和开发者。其强大的性能和创新的设计使其成为未来视觉语言集成领域发展的一个有希望的工具。

文章来源:https://dev.to/nodeshiftcloud/how-to-install-deepseek-janus-pro-7b-locally-5924
PREV
如何使用 Three.js 和 React 渲染你自己的 3D 模型
NEXT
Node.js 动画:事件循环