[A4] 模型的成本分为两个部分:

  • 训练成本:公开资料显示,预训练一个 175B 的 GPT3 模型大约需要 1024 个 A100 训练34天,使用了 300B 个词的语料库。所以成本包括:设备费用(包括机箱、GPU、互联设备)、训练电费、语料收集和清洗费用、工程师费用等。其中光电费可能就有几百万美金。这部分成本需要分摊。
  • 推理成本:模型生成后用于推理时,每次推理也会产生成本。因为模型比较大,对计算设备的算力和内存容量要求比较高,因此需要相对高端的计算设备、以及多个计算设备(如 GPU 等)一起工作才能达到一定的周转延迟(turn-around latency)。

因为目前还在技术期,并未完全展开商业化探索,因此目前的成本还是由投资机构和公司来承担。随着 Bing 接入,意味着开始商业化探索,最终的成本如何分配如何还要看探索的结果。在搜索引擎这种2C产品形态而言,可能最终还是以广告的形式把成本转接给广告主。其他2B/2C的专业内容生产产品形态可能会出现跟用户分摊的方式。