改变世界的 21 种人工智能工具
世界上充满了有前途的人工智能工具,例如 Sora、ChatGPT 以及更多即将问世的工具。
我收集了一些您必须使用的令人惊叹的 AI 工具。
这份清单包括 Devin AI 的开源替代方案、Notion、5 秒语音克隆、电子邮件自动化软件,以及一些你可能从未听说过的工具。好奇心爆棚!
别忘了给他们加星标哦🌟
让我们把一切都讲清楚吧!
1. Taipy——将数据和 AI 算法融入可投入生产的 Web 应用程序中。
Taipy 是一个开源 Python 库,用于轻松进行端到端应用程序开发,具有假设分析、智能管道执行、内置调度和部署工具。
我相信大多数人都不明白 Taipy 是用来为基于 Python 的应用程序创建 GUI 界面并改进数据流管理的。
因此,您可以绘制数据集的图表并使用类似 GUI 的滑块来提供使用其他有用功能来处理数据的选项。
Streamlit 虽然是一款热门工具,但在处理大型数据集时性能会显著下降,因此不适用于生产级应用。
而 Taipy 则在兼顾性能的同时,提供了简洁易用的特性。试用 Taipy,您将亲身体验其用户友好的界面和高效的数据处理能力。
在底层,Taipy 利用各种库来简化开发并增强功能。
使用以下命令开始。
pip install taipy
我们来谈谈最新的Taipy v3.1 版本。
最新版本使得 Taipy 多功能部件对象中任何 HTML 或 Python 对象都能够可视化。
这意味着Folium、Bokeh、Vega-Altair和Matplotlib等库现在都可以用于可视化。
这也带来了对Plotly python的原生支持,使得绘制图表变得更加容易。
他们还使用分布式计算提高了性能,但最好的部分是 Taipy,它的所有依赖项现在都与 Python 3.12 完全兼容,因此您可以在使用 Taipy 进行项目时使用最新的工具和库。
您可以阅读文档。
例如,您可以查看聊天演示,它使用 OpenAI 的 GPT-4 API 来生成消息的回复。您可以轻松更改代码以使用任何其他 API 或模型。
另外一个很有用的地方是,Taipy 团队提供了一个名为Taipy Studio的 VSCode 扩展来加速 Taipy 应用程序的构建。
您还可以使用 Taipy 云部署您的应用程序。
如果您想通过博客了解代码库结构,可以阅读HuggingFace 撰写的《使用 Taipy 为您的 Python LLM 创建 Web 界面》 。
尝试新技术通常很困难,但 Taipy 提供了10 多个带有代码和适当文档的演示教程供您遵循。
例如,一些现场演示示例和项目想法:
Taipy 在 GitHub 上拥有 7k+ 颗星,并且正在v3
发布中,因此它们正在不断改进。
2. PR Agent——自动拉取请求分析、反馈、建议的工具。
这是一个开源工具,可以帮助高效地审查和处理拉取请求。它拥有一系列独特的选项,并提供了跨不同 Git 提供商的广泛拉取请求功能。
每天都有数百万个开源项目和数百个 Pull 请求,因此有一个可以为您提供帮助的小朋友真是太好了。
我是一名开源维护者,因此我知道有时候这有多么困难,尤其是每天审查这么多的 Pull 请求。
无论如何,这就是公关代理在幕后的工作方式。
您必须使用 来评论该拉取请求@CodiumAI-Agent /review
,然后代理将回复对该 PR 的审核。有很多可用的选项,例如describe
& improve
。
他们还提供了PR-Agent 工具列表,每个工具都有一个专门的页面来解释如何使用它。
最棒的是,你甚至可以将它作为GitHub Action运行。他们还提供了一个专业版,其中包含更多选项,但免费套餐也足够你开始使用了。
如果你正在寻找好的文章,我推荐《使用 CodiumAI PR-Agent 实现拉取请求自动化审核》和《CodiumAI PR-Agent 让开发者生活更轻松的 5 个理由》。这两篇文章对 PR Agent 进行了详细的概述。
它在 GitHub 上拥有约 3.8k 个 Star,超过 300 位开发者使用,并且使用 Python 构建。虽然它们可能不是特别流行,但它们的用例非常出色。
3. Mintlify - 构建时出现的文档。
Mintlify 是一款人工智能文档编写器,您只需 1 秒即可编写代码文档 :D
几个月前我发现了 Mintlify,从那时起就成了它的忠实粉丝。我看到很多公司都在用它,我甚至用我的公司邮箱生成了完整的文档,结果发现它非常简单易用。如果你想要详细的文档,Mintlify 就是你的解决方案。
另一个用例是根据我们将在此讨论的代码生成文档。
您可以安装VSCode 扩展,也可以将其安装在IntelliJ上。
您只需突出显示代码或将光标放在要记录的行上。然后点击“写入文档”按钮(或按 ⌘ + .)。
如果你更喜欢教程,可以看看《Mintlify 的工作原理》。它支持 10 多种编程语言,并支持许多文档字符串格式,例如 JSDoc、reST、NumPy 等。
顺便说一下,他们的网站链接是writer.mintlify.com;repo 中的当前链接似乎是错误的。
它在 GitHub 上拥有大约 2.4k 个星,受到许多开发人员的喜爱,并且使用 TypeScript 构建。
4.屏幕截图到代码- 放入屏幕截图并将其转换为干净的代码。
这是一个非常流行的开源项目,但我可以肯定地说,很多开发者仍然不知道这一点。使用它,你可以将用户界面构建速度提高 10 倍。
它是一个简单的工具,可以使用 AI 将屏幕截图、模型和 Figma 设计转换为干净、实用的代码。
该应用前端使用 React/Vite,后端使用 FastAPI。您需要一个可以访问 GPT-4 Vision API 的 OpenAI API 密钥,或者如果您想使用 Claude Sonnet 或实验性视频支持,则需要 Anthropic 密钥。您可以阅读指南开始使用。
您可以在托管版本上实时尝试它,并观看wiki 上提供的一系列演示视频。
他们在 GitHub 上拥有 47k+ 颗星,并支持许多技术栈,例如 React 和 Vue,以及不错的 AI 模型,例如 GPT-4 Vision、Claude 3 Sonnet 和 DALL-E 3。
5.FaceSwap——适合所有人的Deepfakes软件。
我一直对 Deepfakes 很着迷,因为这就是某些 AI 的工作方式,尤其是那些使用视频的 AI。
相信我!我们中的许多人甚至不会使用它来制作视频,我们只是修改代码来看看它能做什么,而那些不道德的用途并不能代表它被创建的原因、我们现在如何使用它,或者我们对它的未来的看法。
你应该看看这个视频,了解计算机是如何识别人脸的!看看这个视频,了解神经网络的基本功能。
您可以阅读INSTALL.md获取详细的安装指南。根据文档,您需要一个支持 CUDA 的现代 GPU 才能获得最佳性能。许多 AMD GPU 可通过 DirectML(Windows)和 ROCm(Linux)获得支持。
您可以阅读文档、观看演示视频并访问他们的博客来观看其他用例的会议视频。
我最喜欢的是他们有一个非常简单的部分,介绍任何人都可以为该项目做出贡献,包括对生成模型感兴趣的人、开发人员、非开发人员高级用户、最终用户,当然还有仇恨者:)
他们在 GitHub 上有 48k+ 个星,这使他们足够可信。
6. Amica——允许您在浏览器中轻松地与 3D 角色聊天。
Amica 是一个开源界面,用于与 3D 角色进行交互式通信,具有语音合成和语音识别功能。
您可以导入 VRM 文件,调整声音以适合角色,并生成包含情感表达的响应文本。
他们使用 three.js、OpenAI、Whisper、Bakllava 等技术来实现视觉效果。您可以阅读Amica 的工作原理,了解其中涉及的核心概念。
您可以克隆 repo 并使用它来开始。
npm i
npm run dev
您可以观看这个简短的视频来了解它的功能。
Amica 使用 Tauri 构建桌面应用程序。
他们在 GitHub 上有 400 多个星标,而且看起来非常容易使用。
7. Bark – 文本提示的生成音频模型。
Bark 是由 Suno 开发的基于 Transformer 的文本转音频模型。Bark 可以生成高度逼真的多语言语音以及其他音频,包括音乐、背景噪音和简单的音效。
该模型还可以生成非语言交流,例如笑声、叹息声和哭声。哇!
它拥有 MIT 许可证,这意味着它现在可用于商业用途。
Bark 支持 100 多种语言的扬声器预设。您可以点击此处查看支持的语音预设库。
根据文档,Bark 会尝试匹配给定预设的音调、音高、情感和韵律,但目前不支持自定义语音克隆。该模型还会尝试保留音乐、环境噪音等。这已经超出了任何人的需求。
这就是它的使用方法。如果你想将它与 Transformers 库一起使用,请阅读此文。
from bark import SAMPLE_RATE, generate_audio, preload_models
from scipy.io.wavfile import write as write_wav
from IPython.display import Audio
# download and load all models
preload_models()
# generate audio from text
text_prompt = """
Hello, my name is Suno. And, uh — and I like pizza. [laughs]
But I also have other interests such as playing tic tac toe.
"""
audio_array = generate_audio(text_prompt)
# save audio to disk
write_wav("bark_generation.wav", SAMPLE_RATE, audio_array)
# play text in notebook
Audio(audio_array, rate=SAMPLE_RATE)
Bark 开箱即用,支持多种语言,并能自动根据输入文本识别语言。当输入需要进行代码转换的文本时,Bark 会尝试使用相应语言的母语口音。
您可以阅读文档并查看Google Colab & Replicate上的演示。
您还可以在笔记本部分阅读有关语音一致性增强和其他形式的示例。
它们支持多种语言,如英语、印地语、德语、法语等。
他们在 GitHub 上拥有 30k+ 颗星,并且运营着一个拥有 300000+ 人的社区,这使他们成为值得的选择。
8. GPTDiscord ——Discord 的一体化 GPT 界面。
我是 Discord 上几个社区的成员,具有出色用例的机器人可以改善整体最终用户体验。
这个机器人的功能与 ChatGPT 网页版相同,甚至在某些方面做得更好!
它们支持从多模态图像理解、代码解释、高级数据分析、文档问答、与 Wolfram Alpha 和 Google 访问的互联网连接聊天、AI 审核、使用 DALL-E 生成图像等等!
您可以阅读有关GPTDiscord 的所有高效功能。
您可以阅读安装指南。
他们在 GitHub 上有大约 1.8k+ 个星标,并且肯定在不断进步。
9. Upscayl——开源 AI 图像升频器。
一款免费开源的 AI 图像缩放工具,适用于 Linux、MacOS 和 Windows,秉承 Linux 优先的理念。
它可能与全栈无关,但对于图像缩放非常有用。
Upscayl 凭借先进的 AI 技术,帮您将低分辨率图像转换为高分辨率图像。清晰锐利!
它在 GitHub 上拥有 23k+ 个星,并且基于 TypeScript 构建。
10. AppFlowy ——Notion 的开源替代品。
AppFlowy 是一个由人工智能驱动的安全工作区,类似于您在不失去对数据控制的情况下取得更多成就的概念。
他们还提供移动应用程序,这是一个优点。
他们还支持使用 Supabase 自托管 AppFlowy。这对于喜欢 Supabase 功能或使用 Supabase 作为基础架构的用户来说是理想的选择。
您还应该检查这一点以了解有关数据存储、markdown、快捷方式、主题、涉及的 AI 和插件的更多信息。
AppFlowy 在 GitHub 上拥有 47k+ 颗星,并且有 64+ 个版本。
11. Leon——您的开源个人助理。
Leon 是一个开源个人助理,可以驻留在您的服务器上。
当你要求他做某事时,他会做。
你可以和他说话,他也可以和你说话。你也可以给他发短信,他也可以给你发短信。如果你愿意,Leon 可以离线与你交流,以保护你的隐私。以下是Leon 目前可以使用的技能列表。
你应该读一读Leon背后的故事。你也可以观看这个演示来了解更多关于Leon的信息。
这是 Leon 的高层架构图。
这就是您开始使用 npm 命令的方法。
# install leon global cli
npm install --global @leon-ai/cli
# install leon
leon create birth
您可以阅读文档。
它在 GitHub 上拥有 14k+ 个 Star,并且还在不断增长。
12. n8n——工作流自动化工具。
n8n 是一款可扩展的工作流自动化工具。凭借公平代码分发模型,n8n 将始终提供可见的源代码,支持自托管,并允许您添加自定义函数、逻辑和应用程序。
n8n 基于节点的方法使其具有高度的灵活性,使您能够将任何事物连接到所有事物。
有400 多个集成选项,这简直太疯狂了!
您可以看到所有安装选项,包括 Docker、npm 和 self-host。
使用以下命令开始。
npx n8n
此命令将下载启动 n8n 所需的所有内容。然后,您可以访问 n8n 并通过打开 开始构建工作流程http://localhost:5678
。
在 YouTube 上观看此快速入门视频!
他们还提供初级和中级课程,以便轻松跟进。
他们在 GitHub 上有 39k+ 个 Star,并为整体使用提供了两个包。
13. Quivr——你的GenAI第二大脑。
Quivr,你的第二大脑,利用GenerativeAI的力量,成为你的私人助理!你可以把它想象成黑曜石,但配备了强大的AI功能。
您可以阅读安装指南。
他们可以提供更好的免费套餐计划,但这足以让您进行测试。
它在 GitHub 上拥有 30k+ 颗星,并且有 220 多个版本,这意味着它们在不断改进。
14. meilisearch – 适合您的应用程序、网站和工作流程的搜索 API。
Meilisearch 可帮助您快速打造愉悦的搜索体验,提供开箱即用的功能来加快您的工作流程。
你肯定见过一些软件网站,比如 GitHub 或 Appwrite,它们可以搜索文档Ctrl + k
。而 meilisearch 可以帮你实现同样的功能。
与 Algolia、Typesense 和 Elasticsearch 相比,这是唯一一款基于 Rust 构建的。您可以阅读与其他可用选项的比较:)
美丽搜索不应成为您的主要数据存储。它是一个搜索引擎,而不是数据库。美丽搜索应该只包含您希望用户搜索的数据。如果您必须添加与搜索无关的数据,请务必将这些字段设置为不可搜索,以提高相关性和响应时间。
无论您开发的是网站还是应用程序,Meilisearch 都能提供直观的即输即搜体验,响应时间低于 50 毫秒。
他们提供SDK 和库,以便 Meilisearch 与您喜欢的语言或框架无缝集成。相信我,选项数量多得惊人。
他们还提供了一个抓取工具来自动读取您的文档内容并将其存储到Meilisearch中。
他们展示了许多有用的功能,例如,即使查询中包含他们命名的打字错误和拼写错误,您也可以获得相关的匹配typo tolerance
。
有很多可用的选项,但让我们看看如何使用 React 来实现。
使用以下命令开始。
yarn add react-instantsearch @meilisearch/instant-meilisearch
# or
npm install react-instantsearch @meilisearch/instant-meilisearch
# or
pnpm add react-instantsearch @meilisearch/instant-meilisearch
这就是您可以使用它的方法。
import React from 'react';
import { InstantSearch, SearchBox, Hits, Highlight } from 'react-instantsearch';
import { instantMeiliSearch } from '@meilisearch/instant-meilisearch';
const { searchClient } = instantMeiliSearch(
'https://ms-adf78ae33284-106.lon.meilisearch.io',
'a63da4928426f12639e19d62886f621130f3fa9ff3c7534c5d179f0f51c4f303'
);
const App = () => (
<InstantSearch
indexName="steam-video-games"
searchClient={searchClient}
>
<SearchBox />
<Hits hitComponent={Hit} />
</InstantSearch>
);
const Hit = ({ hit }) => <Highlight attribute="name" hit={hit} />;
export default App
您可以查看此codesandbox以获取详细的入门示例。
正如我所说,它们提供了很多底层功能。例如,您可以使用这些。
npm install @meilisearch/autocomplete-client
npm install @meilisearch/instant-meilisearch
npm install meilisearch-docsearch
meilisearch docsearch
灵感源自 Algolia 搜索文档组件。此外,每个 SDK 都提供包含示例和选项的详细文档,这使得它备受欢迎。
他们在 GitHub 上拥有 42k+ 颗星,并且有v1.7
180 多个版本。
15. Inbox Zero——几分钟内清理您的收件箱。
Inbox Zero 是一款开源电子邮件应用程序,其目标是借助人工智能帮助您快速实现收件箱清零。
它们已获得 Google 的批准,因此这是关注隐私的一个很好的部分。
他们使用 Postgres 作为数据库并基于 TypeScript 构建。
它们具有一些疯狂的功能,例如:
您的电子邮件 AI 助手
-
人工智能代理将允许您根据您提供的规则自动回复、转发或存档电子邮件。
-
他们的AI方案可以帮你一键接受或拒绝。一旦你确信AI可以独立运行,就可以开启全自动模式。
-
你可以用简单的英语进行指导。就像与助手交谈或向 ChatGPT 发送提示一样简单。
您可以自动阻止冷电子邮件
您可以告诉 Inbox Zero 哪些邮件对您来说是冷门邮件。它会根据您的指示屏蔽这些邮件。
分析
了解你的收件箱是处理它的第一步。了解你的收件箱里都塞满了什么邮件。这也能让你有办法立即采取行动。
您可以阅读有关核心功能的信息并观看演示视频。您还可以查看他们的看板来了解计划。
他们在 GitHub 上拥有 1.5k+ 颗星,绝对值得获得更多。
16. Lively——允许用户设置动画桌面壁纸和屏幕保护程序。
这只是为了好玩,我们可以通过代码学到很多关于如何完成它的知识。
你可以观看这个视频来了解它有多么疯狂。
它们提供三种类型的壁纸,包括视频/GIF、网页和应用程序/游戏。
它基于 C# 构建,并且支持一些很酷的功能:
-
Lively 可以通过终端的命令行参数进行控制。您可以将其与其他语言(例如 Python 或脚本软件 AutoHotKey)集成。
-
强大的API集,助力开发者创建交互式壁纸。获取硬件读数、音频图表、音乐信息等。
-
当全屏应用程序/游戏在机器上运行时,壁纸播放会暂停(~0%CPU,GPU 使用率)。
-
您还可以利用机器学习推理来创建动态壁纸。您可以预测任何 2D 图像与相机的距离,并生成类似 3D 的视差效果。太酷了 :D
我见过很多人使用它,其中很多人甚至不知道它是开源的。
它是 2023 年 Microsoft Store 的赢家。
它在 GitHub 上拥有 13000+ 颗星,并发布了 60 个版本。
17. Netron – 神经网络、深度学习和机器学习模型的可视化工具。
Netron 是神经网络、深度学习和机器学习模型的查看器。
Netron 支持 ONNX、TensorFlow Lite、Core ML、Keras、Caffe、Darknet、MXNet、PaddlePaddle、ncnn、MNN 和 TensorFlow.js。
Netron 对 PyTorch、TorchScript、TensorFlow、OpenVINO、RKNN、MediaPipe、ML.NET 和 scikit-learn 提供了实验性支持。
您可以阅读安装说明。
您可以访问网站并打开这些示例模型文件。例如,您可以查看这个演示。
它在 GitHub 上有超过 2.5 万颗星,并且是基于 JavaScript 构建的。它只有v7.5
三个版本,这让我感到困惑,因为我只用过语义版本。我们都同意它的用例非常出色。
18. Cursor——基于 VSCode 的 AI 代码编辑器。
Cursor 是一款专为与 AI 结对编程而设计的代码编辑器。Cursor 适用于 Windows、Mac 和 Linux 系统。
Cursor 不仅仅是一个 Visual Studio Code (VSC) 扩展。它是一个独立的应用程序。不过不用担心!它是 VSC 的一个分支。这意味着它拥有 VSC 的所有功能,并在其基础上构建了更多 AI 功能。
https://github.com/anysphere/priompt
他们之前开源了基于 Codemirror 的编辑器。
基于VSCodium的Cursor版本不开源,只有他们的提示库是开源的。
选项非常丰富,您可以查看功能列表,例如选择用于聊天的 AI 模型、代码库索引和自动终端调试。听起来很酷吧 :D
您应该检查的一些功能包括:
- 允许您通过编辑代码库的“伪代码”版本来编写代码。
- 一旦错误出现在您的终端中,就会自动修复错误。
- 要求 AI 更改一段代码,查看编辑的内联差异。
您还可以阅读其官方网站的更新日志。
您可以阅读有关如何从VSCode 迁移到 Cursor 的信息。
他们也有一个定价模式,但免费层足以让您进行测试!
他们在 GitHub 上拥有超过 1.9 万颗星,并且还会继续增长。正如我所说,这还不是开源的,但未来可能会有所改变。
19. VSCode Debug Visualizer ——VS Code 的扩展,可在调试期间可视化数据。
这个项目令人印象深刻。它不仅有助于高效调试,还能通过可视化帮助学习基本概念,从长远来看,这非常宝贵。
这是一个 VS Code 扩展,用于在调试时可视化数据结构。类似于 VS Code 的监视视图,但对监视值进行了更丰富的可视化。
尽管它们很基础,但它们支持很多语言,例如 Dart/Flutter、JS/TS、Go、Python、C#、Java、C++、Ruby、Rust 和 Swift,所以这是一个加分点。
其他语言和调试器可能也能正常工作。对于仅提供基本支持的语言,只能可视化 JSON 字符串。您需要实现逻辑来为您的数据结构构建此 JSON。完全支持的语言提供数据提取器,可将一些常见的数据结构转换为 JSON。
安装扩展后,您可以使用该命令Debug Visualizer: New View
打开新的可视化视图。
您还可以查看其具有众多选项的可视化游乐场。
他们在 GitHub 上有 7.8k+ 个星标,并且这个数字还在不断增长。
20. OpenDevin——少写代码,多做事。
这是一个开源项目,旨在复制 Devin。Devin 是一位自主的 AI 软件工程师,能够执行复杂的工程任务,并积极与用户合作进行软件开发项目。该项目希望借助开源社区的力量,复制、增强并创新 Devin。
只是想让你知道,这是在 Devin 被介绍之前。
您可以阅读包含要求的安装说明。
他们使用 LiteLLM,因此您可以使用任何基础模型运行 OpenDevin,包括 OpenAI、Claude 和 Gemini。
如果您想为 OpenDevin 做出贡献,您可以查看演示和贡献指南。
它在 GitHub 上拥有 10.7k+ 个 Star,并且正在快速增长。
21.实时语音克隆- 在 5 秒内克隆一个声音,实时生成任意语音。
该项目是使用实时工作的声码器实现从说话人验证到多说话人文本到语音合成(SV2TTS)的迁移学习的实现。
SV2TTS 是一个分为三个阶段的深度学习框架。
在第一阶段,研究人员根据几秒钟的音频创建语音的数字表示。
在第二阶段和第三阶段,研究人员将以此表示作为参考,根据任意文本生成语音。
您可以阅读如何设置项目,其中包括安装要求、下载预训练模型、测试配置、下载数据集和启动工具箱。
观看下面的视频演示!
我一直喜欢开源项目的最好的部分是,他们甚至非常清楚地提到了替代方案,并且像往常一样,他们推荐了一些项目,这些项目可以让你克隆的声音具有更好的保真度和表现力。
他们在 GitHub 上有 5 万多颗星,并且完全基于 Python 构建。到目前为止,它非常可靠。
请在评论中告诉我你在这个列表中发现了哪些有用的 AI 工具 :D
人工智能正在改变世界,最好将人工智能作为朋友,而不是简单地忽略它。
使用这些工具来提高生产力并抓住机会创造非凡的事物。
祝您拥有美好的一天!下次再见。
在 GitHub 和Twitter上关注我。
关注 Taipy 以获取更多类似内容。
文章来源:https://dev.to/taipy/21-ai-tools-that-are-changing-the-world-1o54