构建完美的 AI 应用程序所需的所有工具。

2025-05-28

构建完美的 AI 应用程序所需的所有工具。

过去十年,人工智能领域取得了长足的发展。

从语音助手到软件开发,人工智能无处不在,如果我们正确使用它,它可以非常有用。

在这样的世界里,制作人工智能应用程序是有利可图的,所以在这里我介绍了 25 个开源项目,您可以使用它们来制作您的人工智能应用程序并将其提升到一个新的水平。

还有一些令人兴奋的概念,比如使用语音合成与 3D 角色进行互动交流。坚持到最后。

将会有大量的资源、文章、项目想法、指南等可供后续使用。

让我们把一切都讲清楚吧!


1. Taipy——将数据和 AI 算法融入可投入生产的 Web 应用程序中。

太皮

 

Taipy 是一个开源 Python 库,用于轻松进行端到端应用程序开发,具有假设分析、智能管道执行、内置调度和部署工具。

我相信大多数人都不明白 Taipy 是用来为基于 Python 的应用程序创建 GUI 界面并改进数据流管理的。

因此,您可以绘制数据集的图表并使用类似 GUI 的滑块来提供使用其他有用功能来处理数据的选项。

Streamlit 虽然是一款热门工具,但在处理大型数据集时性能会显著下降,因此不适用于生产级应用。
而 Taipy 则在兼顾性能的同时,提供了简洁易用的特性。试用 Taipy,您将亲身体验其用户友好的界面和高效的数据处理能力。

在底层,Taipy 利用各种库来简化开发并增强功能。

图书馆

使用以下命令开始。

pip install taipy
Enter fullscreen mode Exit fullscreen mode

我们来谈谈最新的Taipy v3.1 版本

最新版本使得 Taipy 多功能部件对象中任何 HTML 或 Python 对象都能够可视化。
这意味着FoliumBokehVega-AltairMatplotlib等库现在都可以用于可视化。

这也带来了对Plotly python的原生支持,使得绘制图表变得更加容易。

python plotly

他们还使用分布式计算提高了性能,但最好的部分是 Taipy,它的所有依赖项现在都与 Python 3.12 完全兼容,因此您可以在使用 Taipy 进行项目时使用最新的工具和库。

您可以阅读文档

例如,您可以查看聊天演示,它使用 OpenAI 的 GPT-4 API 来生成消息的回复。您可以轻松更改代码以使用任何其他 API 或模型。

聊天演示

另外一个很有用的地方是,Taipy 团队提供了一个名为Taipy Studio的 VSCode 扩展来加速 Taipy 应用程序的构建。

太平工作室

您还可以使用 Taipy 云部署您的应用程序。

如果您想通过博客了解代码库结构,可以阅读HuggingFace 撰写的《使用 Taipy 为您的 Python LLM 创建 Web 界面》 。

尝试新技术通常很困难,但 Taipy 提供了10 多个带有代码和适当文档的演示教程供您遵循。

例如一些现场演示示例:

Taipy 在 GitHub 上拥有 7k+ 颗星,并且正在v3发布中,因此它们正在不断改进。

利桑·阿尔·盖布

星太皮⭐️


2. Supabase - 开源 Firebase 替代品。

超碱基

 

要构建 AI 应用程序,您需要一个后端,而 Supabase 作为优秀的后端服务提供商可以满足这一需求。

使用以下 npm 命令 (Next.js) 开始。

npx create-next-app -e with-supabase
Enter fullscreen mode Exit fullscreen mode

这就是您可以使用 CRUD 操作的方式。

import { createClient } from '@supabase/supabase-js'

// Initialize 
const supabaseUrl = 'https://chat-room.supabase.co'
const supabaseKey = 'public-anon-key'
const supabase = createClient(supabaseUrl, supabaseKey)

// Create a new chat room
const newRoom = await supabase
  .from('rooms')
  .insert({ name: 'Supabase Fan Club', public: true })

// Get public rooms and their messages
const publicRooms = await supabase
  .from('rooms')
  .select(`
    name,
    messages ( text )
  `)
  .eq('public', true)

// Update multiple users
const updatedUsers = await supabase
  .from('users')
  .eq('account_type', 'paid')
  .update({ highlight_color: 'gold' })
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档

您可以构建一个速度超快的应用程序,包含 Auth、实时功能、Edge 函数、存储等等。Supabase 应有尽有!

Supabase 还提供了几个入门套件,例如带有 LangChain 的 Nextjs带有 Nextjs 的 StripeAI Chatbot

Supabase 在 GitHub 上拥有 63k+ 颗星,并有大量贡献者提交了 27k+ 次。

星号 Supabase ⭐️


3. Chatwoot - 实时聊天、电子邮件支持、全渠道服务台和拥有自己的数据。

查特沃特

 

Chatwoot 连接流行的客户沟通渠道,如电子邮件、网站实时聊天、Facebook、Twitter、WhatsApp、Instagram、Line 等。这可以帮助您通过单一仪表板在各个渠道提供一致的客户体验。

这在各种情况下都很重要,例如当您围绕 AI 应用程序构建社区时。

chatwoot 功能

您可以阅读文档来发现各种集成选项,从而更轻松地管理整个生态系统。

他们有非常详细的文档以及每个集成的快照示例,例如WhatsApp 频道与 WhatsApp Cloud API。您可以一键部署到 Heroku,也可以根据需要自行托管。

他们在 GitHub 上拥有 18k+ 颗星并且即将v3.6发布。

星空聊天⭐️


4. CopilotKit——数小时内为您的产品提供 AI 辅助驾驶。

副驾驶套件

 

您可以使用两个 React 组件将关键的 AI 功能集成到 React 应用中。它们还提供内置(完全可定制)的 Copilot 原生 UX 组件,例如<CopilotKit /><CopilotPopup /><CopilotSidebar /><CopilotTextarea />

使用以下 npm 命令开始。

npm i @copilotkit/react-core @copilotkit/react-ui @copilotkit/react-textarea
Enter fullscreen mode Exit fullscreen mode

这就是您集成 CopilotTextArea 的方法。

import { CopilotTextarea } from "@copilotkit/react-textarea";
import { useState } from "react";

export function SomeReactComponent() {
  const [text, setText] = useState("");

  return (
    <>
      <CopilotTextarea
        className="px-4 py-4"
        value={text}
        onValueChange={(value: string) => setText(value)}
        placeholder="What are your plans for your vacation?"
        autosuggestionsConfig={{
          textareaPurpose: "Travel notes from the user's previous vacations. Likely written in a colloquial style, but adjust as needed.",
          chatApiConfigs: {
            suggestionsApiConfig: {
              forwardedParams: {
                max_tokens: 20,
                stop: [".", "?", "!"],
              },
            },
          },
        }}
      />
    </>
  );
}
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档

其基本思想是在几分钟内构建可用于基于 LLM 的全栈应用程序的 AI 聊天机器人。

明星 CopilotKit ⭐️


5. DALL·E Mini——根据文本提示生成图像。

从文本生成图像

 

OpenAI 拥有第一个令人印象深刻的图像生成模型 DALL·E。

Craiyon/DALL·E mini 尝试使用开源模型来重现这些结果。

如果您对这个名字感到好奇,DALL-E mini 已根据母公司的要求更名为 Craiyon,并以更易于访问的 Web 应用程序格式使用了类似的技术。

您可以在Craiyon上使用该模型

克雷永

使用以下命令开始(用于开发)。

pip install dalle-mini
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档

您可以阅读DALL-E Mini 说明以了解有关所涉及的数据集、架构和算法的更多信息。

您可以阅读《最佳逼真 AI 图像和提示的终极指南》,以便通过优质资源更好地理解。

DALL·E Mini 在 GitHub 上拥有 14k+ 颗星,目前正处于v0.1发布阶段。

明星DALL·E Mini⭐️


6. Deepgram——在您的应用中构建语音 AI。

深度图

 

从初创公司到 NASA,Deepgram API 每天都用于转录和理解数百万分钟的音频。快速、准确、可扩展且经济高效。

它为开发人员提供语音到文本和音频智能模型。

deepgram 选项

尽管他们有免费增值模式,但免费套餐的限制足以让你开始使用。

可视化程度达到了新的高度。您可以查看直播响应,或查看音频文件,并比较音频的智能程度。

流媒体

情绪分析

您可以阅读文档

您还可以阅读 Deepgram 的示例博客,了解如何将语音识别添加到您的 React 和 Node.js 项目

如果您想尝试 API 来亲自了解模型的灵活性,请查看其API Playground

星 Deepgram ⭐️


7. InvokeAI——稳定扩散模型的领先创意引擎。

调用AI

 

关于

InvokeAI 是 Stable Diffusion 的一个实现,它是一个开源的文本到图像和图像到图像生成器。

它可以在 Windows、Mac 和 Linux 机器上运行,并在仅具有 4 GB RAM 的 GPU 卡上运行。

该解决方案提供业界领先的 WebUI,支持通过 CLI 进行终端使用,并作为多种商业产品的基础。

调用人工智能

您可以阅读有关安装和硬件要求如何安装不同型号以及最重要的自动安装的信息

令人兴奋的功能是能够使用另一个图像生成一个图像,如文档中所述。

InvokeAI 在 GitHub 上拥有近 21,000 个星标,

明星 InvokeAI ⭐️


8. OpenAI——您所需要的一切。

开放人工智能

 

谷歌的 Gemini 和 OpenAI 非常受欢迎,但在本榜单中我们主要关注 OpenAI。

如果你想了解更多,可以阅读Medium 上关于使用 React 🤖 在网页端实现 Google AI Gemini API 的文章。它简洁明了,切中要点。

借助 OpenAI,您可以使用 DALL·E(根据文本描述创建原创逼真的图像和艺术作品)、Whisper(语音识别模型)和 GPT-4。请在评论区分享关于 Sora 的内容!

您可以使用简单的 API 开始构建。

completion = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "What are some famous astronomical observatories?"}
  ]
)
Enter fullscreen mode Exit fullscreen mode

你可以阅读文档。它提供了大量的选项来构建一些非常酷的东西!

文档概述

甚至 Stripe 也使用 GPT-4 来改善用户体验。

例如,您可以创建助手应用程序并查看API 游乐场以更好地理解它。

GPT-3

如果您需要指南,可以阅读Dzone 的《将 ChatGPT 与 ReactJS 集成》

在这期间,OpenAI 收购了 Sora,从而获得了垄断地位。您对此有何看法?

星级 OpenAI ⭐️


9. DeepFaceLab——领先的深度伪造软件。

deepfacelab

 

DeepFaceLab 是制作深度伪造的顶级开源工具。

Deepfakes 是利用深度学习技术制作的经过修改的图像和视频。它们常被用来交换图片或视频片段中的面孔,有时是为了开玩笑,但有时也是为了造成伤害。

DeepFaceLab 是一款基于 Python 构建的强大深度伪造工具。它可以改变媒体中的面孔,甚至消除皱纹和衰老痕迹。

这些是您可以使用 DeepFaceLab 做的一些事情。

  • 更换面容。

更换脸部

图片描述

  • 更换头部。

更换头部

  • 操纵嘴唇。

您可以使用此基本教程了解如何有效地使用 DeepFaceLab来完成这些事情。

你可以在YouTube上看到使用此DeepLab算法的视频。

不幸的是,DeepFaceLab 中没有“使一切正常”按钮,但值得根据您的特定需求学习其工作流程。

尽管它于 2023 年 11 月 9 日存档,在 GitHub 上已有近 44k+ 颗星,但由于其拥有众多教程和可靠的算法,它仍然是您的 AI 应用程序的可靠选择。

星级 DeepFaceLab ⭐️


10. Detectron2——一个基于 PyTorch 的模块化对象检测库。

探测器2

 

Detectron2 是 Facebook AI Research 的下一代库,提供最先进的检测和分割算法。它是 Detectron 和 maskrcnn-benchmark 的后继者。
它支持 Facebook 上的多个计算机视觉研究项目和生产应用程序。

使用Facebook 开发者倡导者的YouTube 教程将 Detectron2 与机器学习结合使用。

Detectron2 旨在支持多种最先进的物体检测和分割模型,同时也适应不断发展的前沿研究领域。

您可以阅读如何开始,以及深入介绍 Detectron 目标的Meta Blog 。

旧版 Detectron 使用的是 Caffe,后来结合 Caffe2 和 PyTorch 的代码修改使其难以使用。为了响应社区反馈,Facebook AI 发布了更新版 Detectron2,使其更加易于使用。

Detectron2 配备了用于物体检测的高级算法,如 DensePose 和全景特征金字塔网络。

此外,Detectron2 可以进行语义分割和全景分割,有助于更准确地检测和分割图像和视频中的对象。

Detectron2 不仅支持使用边界框和实例分割蒙版进行对象检测,还可以像 Detectron 一样预测人体姿势。

它们在 GitHub repo 上有 28k+ 个星标,并被 GitHub 上的 1.6k+ 名开发人员使用。

星探测器2⭐️


11.FastAI-深度学习库。

快速人工智能

 

Fastai 是一个多功能的深度学习库,旨在满足从业者和研究人员的需求。它为从业者提供了高级组件,使他们能够在常见的深度学习任务中快速取得顶尖成果。

同时,它为研究人员提供了低级组件来实验和开发新方法。

Detectron2 通过其分层架构在易用性和灵活性之间实现了平衡。
该架构将复杂的深度学习技术分解为易于管理的抽象,简洁地利用了 Python 的动态特性和 PyTorch 的灵活性。

它建立在一系列低级 API 之上,这些 API 提供了可组合的构建块。这样,用户如果想要重写部分高级 API 或添加特定行为以满足自身需求,就无需学习如何使用最低级别的 API。

架构 API

安装 pyTorch后,请开始使用以下命令

conda install -c fastai fastai
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档

它们有不同的起点,分别针对初学者、中级和专家的教程。

如果您想为 FastAI 做出贡献,您应该阅读他们的代码样式指南

如果您更喜欢视频,您可以观看Jeremy Howard 在 YouTube 上制作的课程“0”:面向程序员的实用深度学习(fastai) 。

它们在 GitHub 上拥有 25k+ 颗星,并且已经被 GitHub 上的 16k+ 名开发人员使用。

星级 FastAI ⭐️


12.稳定扩散- 一种潜在的文本到图像扩散模型。

稳定扩散

 

什么是稳定扩散?

稳定扩散是指生成模型中使用的一种技术,特别是在文本到图像合成的背景下,将信息从文本描述传输到图像的过程是逐步且平稳地完成的。

在潜在文本到图像的扩散模型中,稳定扩散可确保来自文本描述的信息在整个模型的潜在空间中持续扩散或铺展。此扩散过程有助于生成与给定文本输入一致的高质量逼真图像。

稳定的扩散机制确保模型在生成过程中不会出现突然的跳跃或不稳定。希望以上内容能帮您理清思路!

下载和采样稳定扩散的一个简单方法是使用扩散器库

# make sure you're logged in with `huggingface-cli login`
from torch import autocast
from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained(
  "CompVis/stable-diffusion-v1-4", 
  use_auth_token=True
).to("cuda")

prompt = "a photo of an astronaut riding a horse on mars"
with autocast("cuda"):
    image = pipe(prompt)["sample"][0]  

image.save("astronaut_rides_horse.png")
Enter fullscreen mode Exit fullscreen mode

您可以阅读研究论文以及有关稳定扩散图像修改的更多信息。

例如,这是输入。

输入

这是稍微放大后的输出。

输出

Stable Diffusion v1 是一种特定的模型配置,其扩散模型采用 860M UNet 和 CLIP ViT-L/14 文本编码器,并配备下采样因子为 8 的自动编码器。该模型在 256x256 图像上进行预训练,随后在 512x512 图像上进行微调。

他们在 GitHub 存储库上有大约 64k+ 个星标。

星稳定扩散⭐️


13. Mocap 无人机- 用于房间规模跟踪的低成本运动捕捉系统。

动作捕捉无人机

 

该项目需要 SFM(运动结构)OpenCV 模块,这需要您从源代码编译 OpenCV。

computer_code目录中运行此命令来安装节点依赖项。

yarn install

yarn run dev // to start the web server.
Enter fullscreen mode Exit fullscreen mode

您将获得前端界面的 URL 视图。

打开一个单独的终端窗口并运行命令python3 api/index.py以启动后端服务器。该服务器负责接收摄像机流并执行运动捕捉计算。

架构如下。

建筑学

您可以观看此YouTube 视频来了解 Mocap 无人机的工作原理,或者参阅该项目所有者的博客。

您可以阅读文档

这是一个最近的开源项目,在 GitHub 存储库上有 900+ 颗星。

星空动捕无人机⭐️


14. Whisper Speech – 通过反转 Whisper 构建的文本到语音系统。

低声说话

 

该模型与稳定扩散类似,但用于语音,功能强大且高度可定制。

该团队确保使用经过适当许可的语音记录,并且所有代码都是开源的,从而使该模型可安全地用于商业应用。

目前,这些模型是在英文 LibreLight 数据集上进行训练的。

您可以进一步研究该架构

建筑学

您可以听到示例声音并使用colab亲自尝试。

它们相当新,在 GitHub 上有大约 3k+ 颗星。

星之私语⭐️


15. eSpeak NG – 支持一百多种语言和口音的语音合成器。

eSpeak NG

 

eSpeak NG 是一款紧凑型开源软件文本转语音合成器,适用于 Linux、Windows、Android 和其他操作系统。它支持 100 多种语言和口音。它基于 Jonathan Duddington 创建的 eSpeak 引擎。

您可以阅读各种系统上的安装指南。

对于类似 Debian 的发行版(例如 Ubuntu、Mint 等)。您可以使用此命令。

sudo apt-get install espeak-ng
Enter fullscreen mode Exit fullscreen mode

您可以查看支持的语言列表、阅读文档并查看功能

该模型将文本转换为音素代码,表明其作为另一个语音合成引擎的前端具有潜在的潜力。

他们在 GitHub 上有 2.7k+ 个 Star,

星级 eSpeak NG ⭐️


16.聊天机器人 UI - 适合每个模型的 AI 聊天。

图片描述

 

我们都用过 ChatGPT,这个项目可以帮助我们为任何 AI 聊天机器人设置用户界面。省去不少麻烦!

您可以阅读安装指南来安装 docker、supabase CLI 和其他内容。

您可以阅读文档并查看演示

这在底层使用了 Supabase(Postgres),这就是我们之前讨论它的原因。

我没有讨论 Vercel AI 聊天机器人,因为它与这个聊天机器人相比相当新。

Chatbot UI 在 GitHub 上拥有大约 25k+ 个 Star,因此它仍然是开发人员为任何聊天机器人构建 UI 界面的首选。

明星聊天机器人用户界面⭐️


17. GPT-4 和 LangChain - 用于大型 PDF 文档的 GPT4 和 LangChain 聊天机器人。

聊天架构

 

这可以用于新的 GPT-4 API,为多个大型 PDF 文件构建一个 chatGPT 聊天机器人。

该系统使用 LangChain、Pinecone、Typescript、OpenAI 和 Next.js 构建。LangChain 是一个简化可扩展 AI/LLM 应用程序和聊天机器人开发的框架。Pinecone 用作向量存储,用于以文本格式存储嵌入和 PDF,以便日后检索类似文档。

您可以阅读涉及克隆、安装依赖项和设置环境 API 密钥的开发指南。

您可以观看YouTube 视频,了解如何跟随并使用此功能。

他们在 GitHub 上仅用 34 次提交就收获了 14000+ 颗星。不妨在你的下一个 AI 应用中尝试一下!

星级 GPT-4 & LangChain ⭐️


18. Amica——允许您在浏览器中轻松地与 3D 角色聊天。

阿米卡

 

Amica 是一个开源界面,用于与 3D 角色进行交互式通信,具有语音合成和语音识别功能。

您可以导入 VRM 文件,调整声音以适合角色,并生成包含情感表达的响应文本。

他们使用 three.js、OpenAI、Whisper、Bakllava 等技术来实现视觉效果。您可以阅读Amica 的工作原理,了解其中涉及的核心概念

您可以克隆 repo 并使用它来开始

npm i

npm run dev
Enter fullscreen mode Exit fullscreen mode

你可以阅读文档并查看演示,它非常棒:D

演示

您可以观看这个简短的视频来了解它的功能。

Amica 使用 Tauri 构建桌面应用程序。别担心,我们稍后会在本列表的后面部分介绍 Tauri。

他们在 GitHub 上有 400 多个星标,而且看起来非常容易使用。

明星阿米卡⭐️


19. Hugging Face Transformers ——Pytorch、TensorFlow 和 JAX 最先进的机器学习。

拥抱脸变形金刚

 

Hugging Face Transformers 可以轻松访问最先进的预训练模型和算法,用于文本分类、语言生成和问答等任务。该库基于 PyTorch 和 TensorFlow 构建,使用户能够以最小的投入将高级 NLP 功能无缝集成到他们的应用程序中。

Hugging Face Transformers 拥有大量预先训练的模型和支持社区,简化了基于 NLP 的解决方案的开发。

这些模型可用于执行文本相关任务,例如文本分类、信息提取、问答、摘要、翻译和文本生成,支持 100 多种语言。
它们还可以处理图像相关任务,例如图像分类、目标检测和分割,以及音频相关任务,例如语音识别和音频分类。
它们还可以在各种模式下执行多任务处理,包括表格问答、光学字符识别、从扫描文档中提取信息、视频分类和视觉问答。

您可以看到许多可用的模型。

您可以浏览文档以获取完整的目标和示例,其中展示了您可以执行的各种任务。

例如,使用管道的一种方法是进行图像分割。

from transformers import pipeline

segmenter = pipeline(task="image-segmentation")
preds = segmenter(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)
preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]
print(*preds, sep="\n")
Enter fullscreen mode Exit fullscreen mode

Transformer 由三个最广泛使用的深度学习库(Jax、PyTorch 和 TensorFlow)支持,并且它们之间无缝集成。这种集成使得使用一个库轻松训练模型,然后使用另一个库加载模型进行推理成为可能。

它在 GitHub 上拥有约 12 万多颗星,并被 14.2 万多位开发者使用。快来试试吧!

明星抱脸变形金刚⭐️


20. LLAMA – LLaMA 模型的推理代码。

骆驼

 

Llama 2 是 Facebook Research 开发的一项尖端技术,它使个人、创作者、研究人员和各种规模的企业能够使用大型语言模型负责任地实验、创新和扩展他们的想法。

最新版本包括预训练和微调的 Llama 语言模型的模型权重和起始代码,参数范围从 7B 到 70B。

从涵盖以下步骤的安装指南开始。

  • 克隆并下载存储库。
  • 安装所需的依赖项。
  • 从 Meta 网站注册并下载模型。
  • 运行提供的脚本来下载模型。
  • 使用提供的命令在本地运行所需的模型。

您可以观看ZeroToMastery 制作的YouTube 视频,了解什么是骆驼。

您还可以在Hugging FaceMeta 官方页面上查看模型列表和更多信息

Ollama 基于 llama,它在 GitHub 上拥有超过 5 万颗星。请参阅文档并使用此模型进行更多研究。

星骆驼⭐️


21. Fonoster ——Twilio 的开源替代品。

福诺斯特

Fonoster Inc. 研究了一种创新的可编程电信堆栈,该堆栈将允许企业使用完全基于云的实用程序将电话服务与互联网连接起来。

 

根据您想要实现的目标,有多种开始方式。

使用以下 npm 命令开始。

npm install @fonoster/websdk
// CDN is also available
Enter fullscreen mode Exit fullscreen mode

例如,这就是如何使用 Fonoster 与 Google Speech API。(您将需要服务帐户的密钥)

npm install @fonoster/googleasr @fonoster/googletts
Enter fullscreen mode Exit fullscreen mode

这就是您可以配置语音服务器以使用插件的方法。

const { VoiceServer } = require("@fonoster/voice");
const GoogleTTS = require("@fonoster/googletts");
const GoogleASR = require("@fonoster/googleasr");
const voiceServer = new VoiceServer();
const speechConfig = { keyFilename: "./google.json" };

// Set the server to use the speech APIS
voiceServer.use(new GoogleTTS(speechConfig));
voiceServer.use(new GoogleASR(speechConfig));

voiceServer.listen(async(req, res) => {
  console.log(req);
  await res.answer();
  // To use this verb you MUST have a TTS plugin
  const speech = await res.gather();

  await res.say("You said " + speech);
  await res.hangup();
});
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档

他们提供免费套餐,足以让您开始使用。

他们在 GitHub 上拥有大约 6k+ 颗星,并且有超过 250 个版本。

星空之星⭐️


22. DIPY ——Python 中的 paragon 3D/4D+ 成像库。

迪吡

 

DIPY 是 Python 中领先的 3D/4D+ 成像库。它包含用于空间规范化、信号处理、机器学习、统计分析和医学图像可视化的各种方法。

此外,它还包含计算解剖学的专门方法,包括扩散、灌注和结构成像。

您可以开始使用。

pip install dipy

// run this in python console
import dipy
print(dipy.get_info())
Enter fullscreen mode Exit fullscreen mode

如果您使用的是 anaconda 或其他系统,您可以阅读完整的安装指南。

您可以阅读文档并访问他们的YouTube 频道

您可以查看详细示例。

示例

他们的下载量超过 428k,GitHub 存储库上有 600 多个星标。

星 DIPY ⭐️


23. Elastic Search – 免费开放、分布式、RESTful 搜索引擎。

弹性搜索

数据拟合

 

Elasticsearch 是一个分布式、RESTful 搜索和分析引擎,能够解决大量用例。

作为 Elastic Stack 的核心,它集中存储您的数据,以实现闪电般的快速搜索、微调的相关性以及可轻松扩展的强大分析功能。

他们已经说明了使用 ElasticSearch 的用例。

用例

Elasticsearch 使用标准的 RESTful API 和 JSON。我们还使用多种语言构建和维护客户端,例如 Java、Python、.NET、SQL 和 PHP。

该结构如下。

const { Client } = require('@elastic/elasticsearch')
const client = new Client({ node: 'http://localhost:9200' })

client
  .search({
    index: 'social-*',
    body: {
      query: { match: { message: 'myProduct' } },
      aggs: {
        top_10_states: {
          terms: { field: 'state', size: 10 }
        }
      }
    }
  })
  .then(({ body }) => {
    const { hits } = body.hits
    console.log(hits)
  })
  .catch(console.error)
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档并查看功能列表

尽管 Elastic Search 功能实用,但它的主要缺点是没有免费套餐。不过,您仍然可以利用免费试用版来探索和了解这个开源项目的架构。

Elastic Search在 GitHub 上拥有超过 67,000 颗星,贡献者近 1,900 人,并且在v8发布的同时,还在不断发展和改进。

星号 Elastic Search ⭐️


24. Tauri——使用 Web 前端构建更小、更快、更安全的桌面应用程序。

金牛座

 

Tauri 是一个工具包,旨在帮助开发者利用几乎所有可用的前端框架,为主流桌面平台创建应用程序。它的核心基于 Rust 开发,而 CLI 则利用 Node.js,从而提供了一种真正的多语言方法来开发和维护卓越的应用程序。

Tauri 应用程序中的用户界面目前利用 Tao 作为 macOS、Windows、Linux、Android 和 iOS 上的窗口处理库。

Tauri 使用 WRY 库来渲染您的应用,该库为系统 WebView 提供了统一的接口。它利用 macOS 和 iOS 上的 WKWebView、Windows 上的 WebView2、Linux 上的 WebKitGTK 以及 Android 上的 Android System WebView。

您可以使用 Vite、HTML/CSS/JS、Next.js、Svelte 等等。

使用以下 npm 命令开始。

npm create tauri-app@latest
Enter fullscreen mode Exit fullscreen mode

您可以阅读文档并查看Tauri 的功能列表。

你甚至可以用 Tauri 创建自己的 CLI,这太酷了 :)

该团队提供了YouTube 视频,以便您了解有关 Tauri 的更多信息。

他们在 GitHub 上拥有 75k+ 颗星,并且有超过 800 个版本。

金牛座⭐️


25. AutoGPT——比ChatGPT更令人兴奋。

自动 GPT

 

AutoGPT 的核心是其主要项目,即由大型语言模型 (LLM) 驱动的半自主代理,旨在为您执行任何任务。

AutoGPT 项目由四个主要组件组成:

  • 代理 – 也称为“AutoGPT”
  • 基准——又名农业基准
  • 熔炉
  • 前端

了解如何使用 OpenAI 密钥设置 AutoGPT 。

您可以观看Fireship 制作的 YouTube 视频,了解什么是 AutoGPT。

您还可以观看Sentral Media 的AutoGPT 教程。

您可以阅读文档并查看项目板,了解目前正在开发的内容。

即使您对 AI 了解不多,您也可以尝试 AutoGPT 来了解如何节省时间并构建很酷的东西。

由于其出色的用例和自动化功能,它们在 GitHub Repo 上拥有约 159k+ 颗星。

星级 AutoGPT ⭐️


还没完呢!
现在,让我们探索一些宝贵的资源,它们将帮助你学习新概念,并开发更好的 AI 应用。
我们会尽量简化。请稍等!

希望这能帮助您学习更多概念!


我希望你能在列表中找到一些有用的东西。

我介绍了一些很棒的开源项目,它们可以将您的 AI 应用提升到一个新的水平。

人工智能正在改变世界,与其忽视人工智能,不如将其视为朋友。

利用它提高生产力并抓住机会开发一些非凡的东西。

如果您想以最佳方式改进您的项目,一些开源项目比其他项目更有用,尤其是 Taipy 和 AutoGPT。

请在下面发表评论,让我们知道哪个项目最让您感到惊讶。

祝您拥有美好的一天!下次再见。

在 GitHub 上关注我。

Anmol-Baranwal (Anmol Baranwal) · GitHub

技术作家(阅读量超过 100 万)。软件开发人员(PR 超过 200)。💜 热爱开源 - Anmol-Baranwal

网站图标github.com

关注 Taipy 以获取更多类似内容。

文章来源:https://dev.to/taipy/all-the-tools-i-need-to-build-a-perfect-ai-app-2oeh
PREV
用不到 40 行 Python 代码构建 2025 年的股票仪表板!🤓
NEXT
2025年构建更好数据应用的9个开源工具