经常问的问题
如果您找不到所需的内容,请给我们的支持团队发送电子邮件,如果幸运的话,会有人回复您。
什么是 OpenChatKit 以及它提供什么?
OpenChatKit 是一个开源项目,为为各种应用程序创建专用和通用聊天机器人提供了强大的基础。它由四个关键组件组成:指令调整的大型语言模型、用于微调模型的定制配方、用于通过实时更新信息增强模型的可扩展检索系统,以及用于过滤不适当或不合时宜的内容的审核模型。域问题。
OpenChatKit 和训练数据集背后的合作者是谁?
OpenChatKit 是 Together、LAION 和 Ontocord 之间的合作成果。 Together 是一家为自然语言理解和生成提供开源基础模型的公司。 LAION是一家提供高质量数据注释和管理服务的公司。 Ontocord 是一家提供数据工程和机器学习解决方案的公司。他们共同创建了 OIG-43M 数据集(包含 4300 万条高质量对话指令的集合)和审核数据集(包含针对聊天机器人的不当问题的集合)。
我如何试用 OpenChatKit 并提供反馈?
您可以在 https://openchatkit.net 上试用 OpenChatKit,并通过 OpenChatKit 反馈应用程序提供反馈。您还可以加入 GitHub、Discord、Twitter 和 Medium 上的 OpenChatKit 社区,并分享您的想法、建议和问题。
OpenChatKit 的基本模型是什么以及如何对其进行微调?
OpenChatKit的基础模型是GPT-NeoXT-Chat-Base-20B,这是一个基于EleutherAI的GPT-NeoX模型的200亿参数大语言模型。它根据 OIG-43M 数据集进行了微调,重点关注多轮对话、问答、分类、提取和摘要等多项任务。
OpenChatKit 如何执行不同的自然语言任务?
OpenChatKit 在广泛的自然语言任务中表现良好,尤其是涉及问答、提取和分类的任务。它在几次提示中也表现良好,它可以利用其指令调整来适应不同的任务。然而,OpenChatKit 也有一些需要改进的领域,例如基于知识的封闭式问答、编码任务、重复、上下文切换以及创意写作和较长的答案。
我如何在工作中引用或参考 OpenChatKit 或训练数据集?
您可以使用 GitHub 存储库中提供的 BibTeX 条目来引用或引用 OpenChatKit 或工作中的训练数据集。
OpenChatKit 与其他大型语言模型或聊天机器人相比如何?
OpenChatKit 在多功能性、可定制性和可扩展性方面与其他大型语言模型或聊天机器人相比具有优势。它可以高性能地处理各种自然语言任务,并且可以使用提供的工具和配方针对特定应用程序或领域进行微调和调整。它还可以将来自外部源的实时更新信息与可扩展的检索系统结合起来,并使用审核模型过滤不适当或域外的问题。
OpenChatKit 的许可证是什么?如何修改或检查权重?
OpenChatKit 根据 Apache License 2.0 获得许可,允许您自由使用、修改和分发该软件。您还可以使用 Hugging Face Transformers 库或 GitHub 存储库中提供的 Jupyter 笔记本检查模型的权重。
如何访问 OpenChatKit 的源代码、模型权重和训练数据集?
您可以在 GitHub 上访问 OpenChatKit 的源代码、模型权重和训练数据集。您还可以从 Hugging Face 下载模型权重和数据集。