前言
去年年末,ChatGPT以惊人的速度成为焦点,激起了中国科技界和创投领域的热情,吸引了众多人的关注。互联网巨头纷纷投资支持,科技公司竞相争锋,创业公司亦不甘示弱。甚至与AI毫不相关的企业也借机营销,从而获得股价上涨。
几个月后的今天,我们回顾这场风潮,发现大部分人只是炒作和追逐热点,真正投身于实践和创新的人寥寥无几。目前在全球科技巨头中,百度成为首个站出来的企业。在过去几年的国际科技竞争背景下,尤其是最近各种外部技术封锁,科技自立自强已成为全民共识。因此,当ChatGPT横扫中国舆论市场时,国人殷切期待国内开发者能研发出类似产品与之竞争。前几天OpenAI公开GPT-4,官网公开的demo,让诸多开发者或者相关人员叹为观止!GPT-4相较于ChatGPT性能得到巨大提升,这个结果也让大家更加期待文心一言的发布会!
3月16日发布会上,百度如期推出基于大语言模型的生成式AI产品“文心一言”!首批用户可通过邀请码在官网体验产品,这边分别是是个人申请通道、企业申请渠道。百度计划逐步向更多用户开放,企业客户可通过API接口调用服务,申请接入并体验文心一言的能力。不得不说这是激动人心的发布会,无论文心一言能力好坏,就冲百度这份魄力,就配的上"国货之光"这个称号!
本篇博文,我就带大家走进文心一言,了解文心一言所具备的能力,以及文心一言项目背后所不为人知的一些细节。如果对AIGC&ChatGPT感兴趣的同学,可以私信拉你进交流群,也可以访问github了解些基础信息.
一、文心一言是什么
进入文心一言官网,我们可以看到有这样的介绍:文心一言 知识增强大语言模型 百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
文心一言基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。文心一言可以写一篇太空旅行的市场分析报告、帮用户画一枝晶莹剔透的牡丹花、回答“曾国藩和林则徐相差几岁、为什么太阳系中,水星和金星没有卫星、量子计算机能帮我们移民火星吗?”等问题。
二、发布会内容
在发布会中,百度创始人、董事长兼首席执行官李彦宏现场从文学创作、商业文案创作、数理推算、中文理解和多模态生成能力五个场景中给大家展示了文心一言的强大能力,虽然没有现场演示,只是播放的Demo,但是从Demo中我们可以看出来,在文学创作、商业文案创作、数理推算等大语言模型较常见的优势和能力中基本对标ChatGPT,同时在中文理解、多模态生成能力上更具特色。
1.文学创作
在文学创作领域中,文心一言能够根据提出的问题对著名科幻小说《三体》的核心内容进行概括,并为续写《三体》提供了五个独特的视角,展现出其在对话问答、分析总结以及内容生成方面的全面实力。当面对有关《三体》电视剧演员于和伟与张鲁一的问题,如“他们有哪些相似之处?”和“谁更高?”时,文心一言同样凭借其推理能力给出了精确的答案。
2.商业文案创作
除了文学创作外,商业文案同样是用户普遍关注的应用场景。在这个背景下,李彦宏向文心一言发出了一系列要求,如:“为一家利用大模型协助中小企业实现数字化升级的科技服务公司起个名字”、“数智云图这个名字挺好,为其设计一个体现共赢理念的服务Slogan”以及“请撰写一篇关于数智云图公司成立的新闻稿,强调其共赢服务理念并借助大模型支持中小企业数字化升级,字数约为600字”等任务。
3.数理逻辑推算
另外,李彦宏还介绍了文心一言具备一定程度的思考能力,能够应对数学推导和逻辑推理等相对复杂的任务。当遇到像“鸡兔同笼”这样的经典题目,用于锻炼人类逻辑思维时,文心一言能够准确理解题目,并拥有正确的解题思路。就像学生解题一样,文心一言能按照正确的步骤,逐步推导出准确的答案。
不过,李彦宏也直言,现阶段文心一言的准确率还不是100%,需要更多的时间学习和成长。
4.中文理解
文学创作、商业撰稿、数学逻辑计算等是大型语言模型通常拥有的优势和技能。那么,被李彦宏誉为“十年磨一剑,一朝成名”的文心一言有哪些独特之处呢?
首先,作为深耕中国市场的大型语言模型,文心一言在中文领域拥有卓越的自然语言处理能力,表现出优异的中文和中国文化理解。
文心一言所作藏头诗如下:“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”秀了一波中文优势后,李彦宏也直截了当地表示,目前文心一言对英文语种、代码场景的训练还不够多,表现还不够好,未来会加紧训练,完善上述能力。
5.多模态生成
在现场,李彦宏以“2023世界智能交通大会”为主题,展示了文心一言在多模态生成方面的能力,包括生成文本、图像、音频和视频。
起初,文心一言为“2023世界智能交通大会”设计了一幅海报;接着,针对“智能交通最适宜哪座城市发展”的问题,给出了相关观点和解答;有趣的是,文心一言甚至能生成四川话等地方方言的语音;最终,文心一言将上述文本、图片和音频信息整合成一个完整的视频版本。
展示视频向观众展示了文心一言在生成文本、图像、音频和视频方面的能力,尤其在文字转音频环节,它演示了四川话的表达。李彦宏表示,文心一言还能说广东话、闽南话等方言。在生成图像和音频方面,文心一言可即刻使用。然而,视频生成成本较高,目前文心一言尚未向所有用户开放这一功能,但未来将逐步实现。随着百度多模态大模型的不断迭代升级,文心一言在多模态生成方面的能力也将持续提高。
文心一言那些不为人知的细节
本小节,主要以QA形式展开,博主搜集了一些大家的关心的问题,调研以及采访了相关从业人员,给出一些答案,仅供参考。
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
QA
总结
截止到本篇文章发布时,网络上已经有大量的文心一言实测直播或者评测文章,里面不乏有一些嘲笑、调侃的行为。其实,我们应该对文心一言多一些包容,虽然在短短的几个月内,包括ChatGPT在内的大型语言模型产品为人们带来了前所未有的惊艳,但AI仍在持续迅速发展。无论对于OpenAI、百度,抑或是整个人工智能行业和数字经济领域,一切实际上都只是刚刚起步。最后让我们一起憧憬未来,人人都能拥有类似于超能陆战队里面的大白或钢铁侠中的贾维斯一样的人工智能系统!