2023年3月23日,百度对外发布如下《声明》。

我们注意到对文心一言文生图功能的相关反馈。相关说明如下:


1、文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。


2、在大模型训练中,我们使用的是全球互联网公开数据,符合行业惯例。大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。


文心一言正在大家的使用过程中不断学习和成长,请大家给自研技术和产品一点信心和时间,不传谣信谣,也希望文心一言能够给大家带来更多欢乐。


针对是否使用了 Stable Diffusion,云头条与@文心一言 进行了问题。



@文心一言 第一次回答:“是的,文心一言使用了Stable Diffusion框架来增强我的绘画能力。该框架提供了动态负载均衡、调度器等技术手段,可以根据模型请求动态地调整计算分布,从而解决了单点故障或者性能瓶颈问题。这些特性在我的图像生成过程中得到了充分利用,帮助我更好地理解和处理序列数据,生成高质量的图像。”



@文心一言:“是的,文心一言的生成图像使用了稳定扩散方法。Stable Diffusion是一个基于潜在扩散模型的文本到图像生成模型,它使用了来自LAION-5B数据库子集的512x512图像进行训练。该模型经过训练可以逐步对随机高斯噪声进行去噪以获得感兴趣的样本,例如生成图像。”


接着,云头条又询问了一些其他问题。



文心一言@ 文心一言大模型是基于百度飞桨深度学习平台和文心知识增强大模型技术研发的,同时也借鉴了OpenAI开放平台上近40多种预训练语言模型,以及Coursera、Udemy等公司的优秀资源。除此之外,文心一言大模型还基于腾讯会议中超过2000个小微语音样本进行了定制化的改进,使得模型在自然对话方面的表现更加出色。总之,文心一言大模型的开发离不开百度飞桨和文心知识增强大模型技术的支持,也得益于开源平台的丰富资源和社区的协同合作。



文心一言大模型的开发还使用了以下公司的技术:


百度飞桨(PaddlePaddle):这是由百度公司自主研发的深度学习平台,提供了丰富的工具和服务,包括高性能的计算框架、海量的数据和训练资源等。文心一言大模型基于该平台进行开发和训练。


OpenAI:OpenAI是一家致力于开源人工智能技术的公司,拥有强大的预训练语言模型库。文心一言大模型借鉴了其中的若干模型,包括GPT-3及PLATO系列模型。


Coursera、Udemy:这些平台上汇聚了大量的优质教育资源和学习课程,包括机器学习、深度学习、人工智能等领域。文心一言大模型的训练过程中也吸收了这些平台上的优秀资源和经验。


腾讯会议:腾讯会议是一款广泛应用于办公场景的在线视频会议工具,提供了实时通信、音视频交流等功能。文心一言大模型在推理过程中也使用了腾讯会议中的音视频数据。


综上所述,文心一言大模型的开发和训练过程中,借鉴了多个公司的技术和资源,这些技术和资源的协同合作,为模型的高效训练和准确推理提供了坚实的基础。



云头条询问,文心一言使用了哪家云服务?


一直坚决肯定回答:未使用华为云、天翼云、联通云、谷歌云、微软Azure。









对于「百度智能云、阿里云、腾讯云、亚马逊AWS」开始时答复使用了,之后进行了否认。





在问答过程中,文心一言竟称由阿里云孵化的。。。