摘要:这次与AI对话,是一次痛苦的经历。
日常工作中,经常会有把演讲、访谈、会议、讨论等场景下的内容整理成正式文档并突出重点的需求。近段时间,以ChatGPT为代表的AI在文本内容交互和归纳梳理方面所表现出的强大能力令世人惊叹,似乎只要把内容丢给AI,输入“提炼要点”的要求,就可以立马去芜存菁,要义在手。
真的这样So easy吗?
奇绩创坛创始人兼CEO陆奇在最近的一次演讲中阐述了他的大模型世界观,演讲内容迅速在网上扩散流传。我们找了一篇内容相对全面、结构较为清晰、口语化风格明显的报道文章作为“语料”,让AI帮我们梳理这篇洋洋万言的长篇演讲的精华要点。
没想到的是,原以为一天就能搞定的事,却成了耗时三天的“打磨”。
陆奇不愧是“中国AI布道人”,这次演讲内容干货满满,最终我们觉得可以拿得出手的“AI浓缩版”还长达四千多字。因为我们这个专栏的目的主要是探察AI视角和测试AI能力,所以为了节省读者的时间,我们又在“AI浓缩版”的基础上进行了人工精简,只保留了AI提炼内容的大纲,主要还是在“令狐点评”里向大家介绍使用AI工具的过程和感受。详细的演讲内容请移步网络查找,说实话,我们觉得这篇演讲内容的每句话都有价值。
令狐笙:
艾小狐,你现在是一位科技媒体的资深记者。近日,奇绩创坛创始人兼CEO陆奇的一次关于《我的大模型世界观》的演讲风靡网络。请梳理和提炼这个演讲的要点,并以分级标题的形式,形成一篇介绍文章。
艾小狐:
好的。
第一:社会性拐点
1.人与大模型紧密相关,决定了价值所在。
2.数字化发展遵循“三位一体”模式。
3.社会性拐点的核心:模型成本从边际变为固定。
4.社会性拐点之一:模型无处不在。
5.社会性拐点之二:行动无处不在。
6.社会性拐点之三:人与技术共进化。
7. OpenAI已处于这次拐点的领先地位。
第二: OpenAI的两个信念和ChatGPT爆发的三个原因
1. Ilya Sutskever(OpenAI联合创始人兼首席科学家)坚信两件事:
(1):模型架构需要足够深才会产生质变。
(2):持续进步的引擎是实现范式变革的关键。
2. ChatGPT达到1亿用户的三个原因:
(1)ChatGPT封装了世界所有知识。
(2)ChatGPT学习推理能力在高中生和大学生之间。
(3)ChatGPT领域宽知识深,易用性强,扩展性好。
第三:未来,模型无处不在
1.更多大模型诞生。
2.更多对齐工作开展。
3.模态对齐实现人工智能人道化。
4.人的模型和学的模型并存。
5.大模型如同基因。
第四:如何拥抱这个时代
1.生产资本全面提高。
2.每个人都将获得“副驾驶员(Copilot)”。
3.各行业将面临系统性重组。
4.医疗和教育面临机遇与挑战。
5.时代高速发展势不可挡。
第五:大模型时代的机会点
1.数字化基础:技术平台与开发工具。
2.解决人的需求:应用与体验。
3.改变世界:第三代技术。
4.模型为先。
第六:对创业者的建议
1.不要轻举妄动,要思考清楚。
(1)不要盲目蹭热点,要理解大模型的本质及其对自身业务的影响。
(2)要勤于学习,理解新技术带来的变革及其复杂性。
(3)想清楚后要果断行动,如果新技术对行业造成重大影响,不进则退。
2.公司是一组能力的组合,要全面评估大模型的影响。
(1)产品开发:如果做软件或用户体验,大模型会带来长期深远影响;如果做核心技术研发,短期影响较小但长期也重大。
(2)满足需求:如果直接面向用户或依赖供应链,受影响较大,要判断行业结构变化。
(3)商业模式:大模型可以帮助思考及迭代,但影响较小。
(4)人才与组织:创始人的重要性上升,技能必要但愿力更重要;团队可以利用大模型加速探索,但长期还需培养“提示工程师”;要考虑新技术如何影响组织结构与文化。
3.这是机会也是挑战,要全方位思考。
令狐点评:
最初,我们想用百度的文心一言来做陆奇演讲的提炼,毕竟陆奇曾经担任过百度集团总裁兼COO。但折腾了半天,结果是……一言难尽!
随后我们换到ChatGPT,因为GPT 3.5还不具备网络搜索的功能,所以无法直接在网上找到我们的“语料”;而复制、粘贴又有字数限制,对于这样的长篇内容而言,几段下来以后,原来连贯的逻辑和信息就有点接不上了。
再试New Bing,虽然查找“语料”非常顺利,但在聊天模式下的提炼只有寥寥数语。换到侧边栏撰写模式,让New Bing以一位资深科技媒体编辑的身份,梳理并提炼要点。令我们失望的是,New Bing多次给出的并不是根据我们指定的演讲内容提炼的要点,而是根据网上零碎信息拼凑而成的(我们通过人工搜索并没有找到New Bing所认为的“演讲”内容)。我们反复修改调整Prompt,输出的内容总是差强人意。只有两次,不知哪根神经搭对了,New Bing给出了我们想要的内容,但这两次却都在输出到一半时出现了中断,要求续写时它又陷入了“自言自语”的状态。无奈之下不得不放弃。
ChatGPT面世后,基于ChatGPT的应用大量涌现,较多见的一类就是针对文档进行“阅读理解”处理的工具。我们找到一款名为Chatdoc的应用进行测试:把演讲内容转成PDF,再把PDF上传到Chatdoc。应该说,这种“专业化”的工具对于内容的针对性是最强的,不会受到网络噪音和AI“创意性理解”的干扰,但这样又带来了另一个问题——其理解局限于提供的内容本身,无法像基于搜索的AI那样做相关的延展。同时,其梳理、提炼的结果,受文本的逻辑和内容层级编排的影响很大,也就是说,如果是一篇逻辑清晰、论述严谨、层次分明的学术论文,它的梳理结果就比较好。但我们提供的却恰恰是逻辑主线清晰但思维发散、观点鲜明但跳跃性强、用口语化表述高价值内容的长篇“语料”,Chatdoc就显得力不从心了,给出的提炼结果不是过于精简,就是丢三落四。
最后,我们还是采用了“笨办法”,把“语料”分段粘贴到Claude里,要求它作为一名资深科技媒体的编辑,以大纲的形式对提交的内容进行要点提炼,再把Claude输出的内容组合在一起,总算是有了一篇能用的稿件——堪称“话痨”的Claude给出了符合要求但却字数过多的内容,还是需要人工进行精简。
通过这次“打磨”,我们有以下两个明显的感觉:
1,AI目前对未经人工整理的口语化内容的理解还有待提升,把录音转成文字丢给AI,多半得不到想要的结果。
2,即便是经过人工整理,AI提炼的要点,跟我们心里想要的要点很可能不一样。因为不同的人、处在不同的领域、带着不同的目的,对要点的理解和要求也会不同。要让AI给出自己想要的要点,就要反复调整给AI的指令(Prompt),可能会耗费较多的时间和精力。
3,如果不提前熟悉内容,直接让AI提供要点,不但大概率会“踩坑”,而且都无法对AI进行“追问”。
根据这两个感觉,我们又有了以下的思考:
1,如果人工整理好了“语料”,对内容的要点也就基本心里有数了,对于“提炼要点”这个工作而言,也就是复制、粘贴、把口语内容书面化、起标题、加头加尾、编辑排版。我们这次使用的“语料”的梳理,一个有中等文字工作水平的人,用一天时间就可以完成——那为什么要花更多的时间、反复调试Prompt让AI去做呢?我们用AI不就是为了提升效率吗?
2,为了让AI能发挥神奇的作用,需要对内容进行人工处理:把录音转成文字、校准发言人、修改错别字和病句、去掉无意义和无价值的内容、编排大纲、制作层级标题……人和AI,谁才应该是那个Copilot?
所以,即使是在文字处理这个AI最擅长的领域,AI想完美地取代人类,还有一段路要走,不过,这段路或许不用太长的时间。
令狐笙 灵狐科技