ChatGPT 席卷了技术世界,并且不乏进步和更新。但尽管使用了先进技术,当前版本仍存在不少限制因素。

其中一个因素就是代币系统,它不断打破进化周期,使应用程序的实用性陷入困境。如果您使用 ChatGPT,您可能想了解 ChatGPT 的令牌以及令牌用完时该怎么办。

让我们退后一步,让您深入了解该应用程序的底层工作机制。

什么是 ChatGPT 令牌?

如果您从应用程序的外观来看,您看到的只是一种计算机语言,它服从您的命令并为您提供所需的答案。然而,后端只是大量代码,每分钟都在学习,并加快其回答的问题。

每当您提出问题时,ChatGPT 都会将每个单词转换为清晰的标记。进一步细分,令牌是文本片段,每种编程语言使用一组不同的令牌值来理解需求。

Comparison operators and boolean logic with cpp

由于计算机不能直接理解文本值,因此它们将它们分解为数字组合,通常称为嵌入。您甚至可以考虑像 Python 列表这样的嵌入,它类似于相关数字的列表,例如 [1.1,2.1,3.1,4.1…n]。

一旦 ChatGPT 获取初始输入,它就会尝试根据先前的信息预测下一个可能的输入。它选择先前令牌的整个列表,并使用其编码合成,尝试抢占用户的后续输入。它一次利用并预测一个标记,以使语言更容易理解其用法。

为了增强预测并提高准确性,它会获取整个嵌入列表并将其传递到转换器层以建立单词之间的关联。例如,当您问“谁是托马斯·爱迪生?”之类的问题时,ChatGPT 会挑选列表中最有价值的单词: WHO爱迪生

变压器层在整个过程中发挥着自己的作用。这些层是神经网络架构的一种形式,经过训练可以从一串单词中提取最相关的关键字。然而,训练过程并不像听起来那么简单,因为在千兆字节的数据上训练 Transformer 层需要很长时间。

尽管 ChatGPT 一次仅预测一个令牌,但其自回归技术经过编程可以预测并反馈到主模型中以释放输出。该模型被调整为每个标记仅运行一次,因此一次打印一个单词的结果。当应用程序遇到停止令牌命令时,输出会自动停止。

例如,如果您查看 ChatGPT 网站上的令牌计算器,您可以根据您的问题计算令牌使用情况。

让我们输入一些示例文本,例如:

 如何解释 ChatGPT 中令牌的使用? 

根据计算器,该字符串有 46 个字符,将消耗 13 个令牌。如果将其分解为令牌 ID,它看起来像这样:

 [2437, 466, 314, 4727, 262, 779, 286, 16326, 287, 24101, 38, 11571, 30] 
Tokenizer calculation from OpenAI's website

一个有用的经验法则是,一个标记通常对应于常见英语文本的约 4 个文本字符。这相当于大约 3/4 个单词(100 个标记 ~= 75 个单词)。

免费与付费代币

为了让您了解 ChatGPT 应用程序的功能,OpenAI 为您提供免费的有限令牌订阅。如果您想尝试 ChatGPT API,请使用免费的 5 美元积分,有效期为三个月。一旦限额用完(或试用期结束),您可以按需付费,这会将最大配额增加到 120 美元。

OpenAI dashboard with credit usage graph

ChatGPT Plus:付费订阅值得吗?

要更上一层楼,您甚至可以注册 ChatGPT Plus 优惠,每月可节省 20 美元。鉴于整个人工智能模型的广泛使用和流行,以下是付费订阅模型的主要功能:

  • 即使网站因用户涌入而出现停机,也可访问 ChatGPT
  • 提高回复率
  • 亲身体验新功能和版本

如果您觉得这些功能完全值得并且适合您,您可以注册付费订阅并立即受益。

ChatGPT 代币定价结构

Set of black opened envelope and cash dollars

有几种不同的应用程序模型可用,您可以根据您的要求进行选择:

模型

1000 个代币的输入价格(提示)

1000 个代币的产出价格(完成)

艾达

0.0004 美元

0.0016 美元

巴贝奇

0.0005 美元

$0.0024

居里

0.0020 美元

0.0120 美元

达芬奇

0.0200 美元

0.1200 美元

聊天GPT

0.0020 美元

0.0020 美元

聊天 4K 背景

0.0015 美元

0.002 美元

GPT-4 8k 上下文

0.03 美元

0.06 美元

聊天16K上下文

0.003 美元

0.004 美元

GPT-4 32k 上下文

0.06 美元

0.12 美元

Ada 是最快的,而 DaVinci 是此模型列表中最强大的模型。提示是问题,而完成则涉及答案。

最大代币限制

每个模型都允许您设置每个查询中的最大标记数。此方法控制应用程序在单次调用中生成的最大令牌数,从而限制输出。 max_token 功能非常有用,特别是当您想要控制输出的长度,同时避免过度使用令牌使用量和积分时。默认长度固定为 2,048 个令牌,最大长度可设置为 4,096 个令牌。

限制令牌的使用可能会导致答案简短,这可能会限制输出并损害您的使用体验。

ChatGPT-3 的上限为 4,096;然而,随着 ChatGPT-4 的引入,令牌限制增加如下:

模型

代币限额

艾达

2048

巴贝奇

2048

居里

2048

达芬奇

4096

聊天GPT

4096

GPT-4 8k 上下文

8192

GPT-4 32k 上下文

32768

如果您的输出被截断,您必须增加仪表板中指定的最大限制。请记住,提示和最大令牌的总和应始终小于模型的最大令牌限制。

例如,在 ChatGPT 模型中, 提示令牌 + 最大令牌 <= 4096 代币

学习控制您的 ChatGPT 提示以获得最佳结果

无论您如何使用人工智能驱动的应用程序,您都可能必须想出一些方法来巧妙地处理您的问题和短语。根据您的使用模式,您可能会在每项任务中广泛使用 ChatGPT。

为了获得最佳结果,您必须学习如何使用代币方法并提高您的技能,以确保您的使用限制保持不变,同时为您提供最佳答案。