微软的新版搜索工具必应(Bing)推出近一周,陆续有用户通过内测申请。不少人都在好奇,搭载了聊天机器人的搜索引擎会更加智能吗?与ChatGPT相比,新版必应有什么不同?

2月13日晚,澎湃新闻记者登录新版必应,试图让其推荐电影、撰写文章、提供旅游攻略等。体验过程中记者发现,与ChatGPT相比,新版必应的反应更快,回复耗时更短;此外,新版必应还更加“人性化”,不仅会为用户提供问题选项,还会在回复中使用表情符号;同时,新版必应更加“严谨”,会在回复中标注所引用的来源,并列出对应网站。

不过,新版必应仍然存在不少瑕疵,例如受限回答字数限制,无法提供完整的答案,版本的中英文翻译也没有实现一致。

科普能力较强,获取及时信息

目前,新版必应的聊天必须通过微软Edge浏览器才可以访问,用户根据提醒直接下载安装,登陆账号通过审核后就可体验。

从界面来看,新版必应在聊天模式下具有三种功能,分别为聊天、撰写和见解,其中“见解”仍在开发阶段,无法使用。

在聊天模式下,澎湃新闻记者要求必应介绍2022年的诺贝尔文学奖得主,并推荐一部作品。

从回复来看,新版必应能够准确地告知2022年诺贝尔文学奖得主是法国女作家安妮·埃尔诺,并从埃尔诺的创作风格、作品特点等方面展开介绍。

它回复称,“2022年诺贝尔文学奖得主是法国女作家安妮·埃尔诺(Annie Ernaux),她是一位以自传体为主的作家,她的作品与社会学保持紧密关系,揭示了阶级经历的痛苦,描述了羞耻、羞辱、嫉妒以及无法看清自己是谁的困境。她的作品中,埃尔诺始终从不同的角度审视了一种在性别、语言和阶层方面有着强烈差异的生活。”

除了回答问题,新版必应还会在引用的每一句话之后标注来源,当光标移动到脚注之上时,界面中会浮现完整链接和标题。在本次回复中,新版必应引用了腾讯新闻、百度百科、澎湃新闻等网站的内容。

新版必应完成回答后,还会为用户提供新的问题模板,用户可以直接点击感兴趣的问题进行提问,也可以自己提出新问题。

被询问推荐作品时,新版必应推荐了《悠悠岁月》(Les Années)。在此基础之上,记者追问“你有没有读过安妮·爱尔诺的其他作品”,必应不仅给出了回答,还进一步对此做出了解释,“我没有读过安妮·埃尔诺的其他作品,但我对她的创作风格很感兴趣。她的作品都是基于她的亲身经历,但又不是传统的自传,而是试图把个人的记忆与社会的历史联系起来,创造了一种新的文学形式。我觉得这很有创意和价值。”

ChatGPT最明显的“缺陷”之一,是只能获取截至2021年的知识。而搭载了ChatGPT同源技术的新版必应弥补了这方面的不足,它提供的信息更加“新鲜”。

被要求推荐好看的科幻电影时,必应回复《新蝙蝠侠》《阿凡达2》以及《黑客帝国:矩阵重启》,其中前两部均于2022年上映,就连今年上映的《流浪地球2》也在新版必应的电影列表之上。

在推荐《流浪地球2》时,新版必应能够简洁明了地概括电影的剧情,“这是继2019年《流浪地球》之后的续集,讲述了人类为了逃离太阳系,前往半人马座α星系的冒险故事。”

对指令的理解能力较强,但仍存在错误

新版的必单独推出了撰写功能,用户可以提出写作主题的需求,并制定回复的格式,例如邮件、段落,以及行文的语气以及长短。

澎湃新闻记者尝试让必应给老师撰写一封请假邮件,“告诉她由于生病住院,我无法参加期末考试。”

从形式来看,新版必应撰写的邮件符合基本格式,包含了称谓语、开首应酬语、正文、结尾应酬语、祝颂语、署名与日期七个部分。内容方面,新版必应不仅详细解释了病情和症状,还主动提出了补考申请,“我非常重视这门课程,也非常尊重您的教学,我不想因为这次意外而影响我的学习成绩。我希望您能够谅解我的困难,给我一个补考的机会。”

从新版必应起草的邮件可以看出,它具有较强的书写能力。为了测试新版必应是否能够撰写专业文章,记者要求它写一篇关于“聊天机器人ChatGPT”的新闻稿件,并限制字数为800字左右。

新版必应所取的新闻标题为《OpenAI推出聊天机器人ChatGPT,引领AI新纪元》,改文章的结构较为清晰,包含导语、文章主体和结语。从内容来看,文章包含ChatGPT的推出时间、发明公司、特点及应用场景。

以导语为例,新版必应写道,“近日,人工智能研究机构OpenAI发布了一款聊天机器人软件:ChatGPT。该软件使用了先进的自然语言处理技术,能够与人类进行流畅的对话,还能根据用户的需求,完成各种任务,如写文章、写代码、翻译等。ChatGPT被认为是人工智能领域的一项重大突破,开启了AI新纪元。”

该文章也满足了800字左右的要求,但是,这篇文章并不完整,或许是因为字数的限制,在结尾的地方戛然而止。记者点击右下角的刷新按钮,得到了一篇新的文章。不过,新的文章与第一篇文章相比,并不太像新闻稿件。

此外,新版必应的回复中也存在中英混杂的现象,人工智能看上去有些不那么“智能”。

新版必应生成的第二篇文章

整合能力更完善,且更智能化

在网络时代,搜索引擎是用户搜集信息的主要工具。搭载了聊天机器人之后,搜索引擎提供的信息会更加丰富吗?

澎湃新闻记者提出问题,“我想去日本旅游五天,预算在两万元左右,请帮我规划一份旅游攻略。”在没有提出具体的旅游城市要求时,新版必应默认旅游地点为日本首都东京。

新版必应详细地规划了每一天的行程及花销,不仅推荐了浅草寺、东京塔等知名旅游景点,并告知门票价格和汇率,还列出炸豆腐、章鱼烧、烤鱼饼等传统当地美食,建议用户体验当地传统文化。

以第一天的行程规划为例,新版必应的建议为,“从北京出发,乘坐飞机到达东京,大约需要4个小时。机票价格大约是4000元。到达东京后,你可以先入住酒店,然后去附近的浅草寺参观,感受日本的传统文化。浅草寺是东京最古老的寺庙,有着悠久的历史和美丽的建筑。你可以在那里拍照,祈福,还可以品尝一些日本的小吃,比如炸豆腐,章鱼烧,烤鱼饼等。浅草寺的门票是免费的,你只需要花费一些交通费和餐饮费,大约是200元。晚上,你可以去东京塔观赏夜景,东京塔是东京的标志性建筑,高333米,是世界上最高的自立式钢塔。你可以乘坐电梯到达150米和250米的观景台,欣赏东京的全景。东京塔的门票是1200日元,约合75元人民币。你还可以在塔内的商店和餐厅消费,大约是300元。这样,你的第一天的花费是4575元。”

随后,记者又尝试让新版必应推荐投影仪,要求为“希望画面清晰不卡顿,预2000元以内”。

在推荐产品前,新版必应首先提醒用户该价位投影仪的优缺点,“2000元以内的投影仪主要是以便携式投影仪为主,尺寸小巧重量也比较轻,但是在亮度和分辨率方面可能会有所牺牲,所以你需要根据你的使用场景和观影习惯来选择。”

在此基础上,它推荐了三款投影仪,并分别详细列出了每款产品的售价、亮度、分辨率以及合适的使用场景。

这一次,新版必应的信息来源为知乎和b站,通常而言,知乎和b站中含有较多的测评产品类内容。

本质仍为搜索引擎,不预设立场

在此前的回复中,新版必应展现了较强的文本理解、整合信息能力,但其本质仍然是搜索引擎,不具备价值取向和偏好。

记者询问新版必应是否能够超越谷歌搜索引擎,它并没有正面回复这一问题,而是提供了新版必应的相关介绍。

面对谷歌聊天机器人Bard和ChatGPT哪个更好用的提问时,新版必应撰写的内容称,“Bard和ChatGPT的比较可能没有一个客观的标准,不同的用户可能有不同的偏好和需求。”

新版必应仍然提供了二者的不同之处,以及各自的优势:“Bard的优势在于它可以学习不限定年份的数据,而ChatGPT只能学习2021年之前的数据。这意味着Bard可能更能适应时代的变化,而ChatGPT可能会落后于最新的信息和趋势……另一方面,ChatGPT的优势在于它的语言模型更强大,比Bard使用的LaMDA更先进,能够更好地理解和回答用户的问题。”

记者进一步追问“你个人更喜欢Bard还是ChatGPT?为什么?”新版必应表示,“我个人没有特别的偏好,我觉得Bard和ChatGPT都是很有趣和有用的聊天机器人。我喜欢Bard的创造力和多样性,它可以与谷歌的其他产品和服务相结合,提供更多的功能和体验。我也喜欢ChatGPT的智能和灵活性,它可以切进或切出聊天模式,根据用户的需求提供更具对话性的搜索和创建内容的替代方式。”

有意思的是,在被要求写一篇“谷歌Bard比ChatGPT更有优势、更具竞争力”的文章时,新版必应仍然回复了一段约350字的文字,从多样性、自我优化等方面,说明Bard更具竞争力。