开源是变革性软件的沃土,尤其是在人工智能 (AI) 和机器学习等尖端领域。开源精神和协作工具使团队更容易共享代码和数据,并在他人的成功基础上继续发展。

本文着眼于 13 个正在重塑人工智能和机器学习世界的开源项目。有些是支持新算法的复杂软件包。其他的则更具微妙的变革性。所有这些都值得一看。

TensorFlow 和 PyTorch

如果没有 TensorFlow 和 PyTorch,人工智能和机器学习的开源工具列表就不完整。这些 OG 框架单独或共同支持机器学习和人工智能领域的一些最具实验性和重要的研究。本文中讨论的至少一些项目使用它们作为构建块。

假飞行员

需要一些编码帮助的程序员可以从 FauxPilot 获得。该系统根据现有的生产代码进行自我训练,并从中学习足够的知识以提出结构化的评论和建议。该项目的灵感来自 GitHub Copilot,但 FauxPilot 允许您选择用于训练的存储库。这一额外的控制层可防止您使用来自可能不批准使用的来源的代码片段。如果您选择培训源并将其限制为仅具有适当权限和许可证的培训源,则您使用的编码帮助和片段更有可能是干净且值得信赖的。

达尔-E

了解机器学习模型如何“思考”的最简单方法之一就是开始将单词插入 DALL-E,这是一个非常大的开放模型,由从互联网上挑选的图像和文本描述构建而成。输入一个单词,然后输出一幅 DALL-E 认为匹配的图像。 DALL-E Playground 和 DALL-E Mini 等开源项目使模型实验变得更加容易。它部分是一款游戏,部分是进入人工智能算法思维的门户。

YOLOv7

实时对象检测,或在图像中查找对象,是人工智能的一个棘手领域。它对于自动驾驶汽车、机器人和辅助设备等需要收集和传达准确环境信息的事物也至关重要。 YOLOv7 是最快、最准确的开源目标检测工具之一。只需向该工具提供一组充满对象的图像,然后看看接下来会发生什么。

深脸实验室

Deepfakes 是借助深度学习创建、更改或合成的视频和图像。最常见的例子是将名人或政治家的面孔替换为现有的视频或图像,通常是为了幽默,但有时是出于更邪恶的目的。 DeepFaceLab 是在 Python 上运行的开源 Deepfake 技术。除了将一张脸换成另一张脸之外,它还可以用来去除皱纹和其他年龄和经验的标志。

PaddleNLP

自然语言处理 (NLP) 引擎执行神经搜索和情感分析,然后为人类和机器用户提取和呈现信息。虽然有时仍然很笨拙,但这项技术已经变得足够复杂,可以用于各种应用程序和领域(Alexa 只是一个例子)。 PaddleNLP 是一个流行的开源 NLP 库,您可以使用它来收集搜索情绪并标记重要实体。

思维数据库

人工智能成功的传统途径是将数据存储在数据库中,然后提取数据以发送到单独的机器学习算法。 MindsDB 是一个 SQL 服务器,它将机器学习算法直接集成到数据库中。数据库内机器学习或分析已存储的数据是加快机器学习工作流程的快速有效的方法。

图像超分辨率 (ISR)

照片的细节越多越好,图像超分辨率可以通过提高图像分辨率来添加更多细节。此开源工具采用机器学习模型,您可以训练该模型来猜测低分辨率图像中的细节。有了良好的训练集,模型就可以产生准确的细节和更清晰的图像。

深巴甫洛夫

许多企业和大公司正在用聊天机器人取代客户服务的前线,这意味着机器正在学习如何进行对话。 DeepPavlov 将 TensorFlow、Keras 和 PyTorch 等基本机器学习工具结合在一起,创建聊天机器人供您学习。结果是古怪的、奇怪的,有时,经过正确的训练,甚至是有用的。

搅拌机

将三维模型转换为丰富渲染场景的最佳方法是启动 Blender。虽然许多人认为 Blender 是电影制作人和动画师的工具,但它也是应用人工智能的一个很好的例子。丰富的界面和众多的插件使创建复杂的动态图形或电影远景成为可能。所需要的只是一点创造力,奥斯卡提名委员会很快就会打电话来。人工智能甚至不会要求分享功劳。

开放式计算机视觉

探索机器视觉最丰富的基础之一是 OpenCV,开源计算机视觉库。它包括许多用于识别数字图像中的对象的流行算法,以及专门的例程,例如可以识别和读取汽车牌照的例程。

机器人代码

Robocode 就像算法的饥饿游戏。这款基于 Java 的编程游戏可让您的坦克在争夺统治权的战斗中与其他坦克作战。这是一种有趣的消遣,甚至可能有助于测试自动驾驶汽车的新策略。