拥抱脸 101:绝对初学者的教程!

2025-05-26

拥抱脸 101:绝对初学者的教程!

欢迎学习这篇面向初学者的教程,学习如何使用Hugging Face 的 transforms库进行情绪分析!情绪分析是一种自然语言处理 (NLP) 技术,用于确定文本中表达的情绪基调或态度。

在本教程中,您将学习如何利用Hugging Face预先训练的机器学习模型对各种文本示例进行情感分析。我们将引导您完成整个过程,从安装所需的软件包到运行和解释模型的输出,所有这些都在SingleStore Notebook环境中进行,就像 Jupyter Notebook 一样。

在本教程结束时,您将掌握使用 Hugging Face Transformers 作为分析文本数据情感的库的知识。

什么是拥抱脸🤗?

什么是拥抱脸🤗

Hugging Face🤗 是一个专注于自然语言处理 (NLP) 和人工智能 (AI) 的社区。该公司成立于 2016 年,通过普及最先进的机器学习模型和工具,为自然语言处理 (NLP) 领域做出了重大贡献。

Hugging Face 非常注重社区。他们提供了一个平台,让研究人员和开发者可以分享他们训练好的模型,从而促进合作并加速该领域的进步。

NLP 代表自然语言处理,它是人工智能的一个领域,专注于计算机与人类语言之间的交互。Hugging Face 以其开源库、预训练模型和社区平台对 NLP 的贡献而闻名。

Hugging Face🤗 Transformers 库:

Hugging Face 的 Transformers 库是一个用于 NLP 和机器学习的开源库。它提供了各种预训练模型和架构,例如 BERT、GPT-2、T5 等。该库设计为高度模块化且易于使用,可快速开发研究和生产项目。它支持多种语言和任务,例如文本分类、问答、文本生成、翻译等。

先决条件

在开始本教程之前,请确保您已满足以下先决条件:

  • 本教程的唯一前提条件是 SingleStore Notebook。本教程旨在在 SingleStore Notebook 中进行。如果您尚未安装 SingleStore Notebook,可以通过在 SingleStore 上注册并选择 Notebook 功能来安装。

从单店笔记本开始

创建一个新的空白笔记本。
新笔记本

您将进入 SingleStore Notebook 仪表板。
SingleStore Notebook 仪表板

从这里开始,我们将使用它作为我们的 Python 游乐场来执行我们的命令。

步骤1:安装所需的软件包

首先,你需要安装 Hugging Face 的 transforms 库。你可以使用 pip 来安装:

!pip install transformers
Enter fullscreen mode Exit fullscreen mode

PyTorch 是使用 Hugging Face 变换器库的先决条件。

您可以通过在 SingleStore Notebook 中运行以下命令来安装 PyTorch:

!pip install torch
Enter fullscreen mode Exit fullscreen mode

重启内核:安装完成后,您可能需要重启 SingleStore Notebook 内核,以确保新安装的软件包能够被识别。通常,您可以通过点击菜单中的“内核”,然后选择“重启内核”来执行此操作。

第 2 步:导入库

导入必要的 Python 库。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
Enter fullscreen mode Exit fullscreen mode

步骤3:加载预训练模型和标记器

加载预训练模型及其对应的分词器。本例中,我们使用 distilbert-base-uncased-finetuned-sst-2-english 模型进行情感分析。

tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")
model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")
Enter fullscreen mode Exit fullscreen mode

步骤4:预处理文本

对您想要分析的文本进行标记。

text = "I love programming!"
tokens = tokenizer(text, padding=True, truncation=True, return_tensors="pt")
Enter fullscreen mode Exit fullscreen mode

步骤5:模型推理

将标记化的文本传递到模型。

with torch.no_grad():
    outputs = model(**tokens)
    logits = outputs.logits
    probabilities = torch.softmax(logits, dim=1)
Enter fullscreen mode Exit fullscreen mode

步骤 6:解释结果

解释模型的输出以获取情绪。

label_ids = torch.argmax(probabilities, dim=1)
labels = ['Negative', 'Positive']
label = labels[label_ids]
print(f"The sentiment is: {label}")
Enter fullscreen mode Exit fullscreen mode

这应该根据文本的情绪输出“积极”或“消极”。

确保您在 SingleStore 的 Notebook 游乐场中执行您的代码。
SingleStore 的 Notebook 游乐场

让我们将要分析的文本从“我喜欢编程!”修改为“我讨厌编程!”。你应该看到一个负面情绪分析。

负面情绪分析

让我们再分析一句“SingleStore 的 Notebook 功能真是太棒了!”,看看大家的反应。(正如预期的那样,应该是积极的)

惊人的功能

恭喜您完成了这篇适合初学者的教程,学习如何使用 Hugging Face 的 transforms 库进行情绪分析!现在,您应该已经对如何使用预训练模型分析文本情绪有了扎实的理解。您已经学习了如何对文本进行分词、如何在模型中运行文本以及解释输出结果——所有这些都在 SingleStore Notebook 环境中完成。

文章来源:https://dev.to/pavanbelagatti/hugging-face-101-a-tutorial-for-absolute-beginners-3b0l
PREV
Kubernetes 和免费资源 Kubernetes 如何工作?
NEXT
Docker化你的Node.js应用程序