前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >必应版ChatGPT内测资格海量发放!知乎大佬:别作死,就很强

必应版ChatGPT内测资格海量发放!知乎大佬:别作死,就很强

作者头像
新智元
发布2023-02-24 12:46:30
4990
发布2023-02-24 12:46:30
举报
文章被收录于专栏:新智元


新智元报道  

编辑:编辑部

【新智元导读】ChatGPT版必应对一些网友已经开放测试了,综合大家的反馈,总的来说就是——它很强。

小编还在waiting list上望眼欲穿地苦等,但是幸运的人已经有必应的内测资格了!

话不多说,下面上一波国内外网友的测评。

知友测评

知友「ccskai」表示,相对于ChatGPT,新必应响应速度真的太快了,汉字刷刷地出,几乎不卡壳。

其次在引用上,相对于ChatGPT,必应的AI会去搜索网页,然后总结网页的内容给出答案。这样,在信息的时效性上,必应就比ChatGPT领先了不少。

要求他将文章改成某种风格,它会先去搜某种风格怎么改,然后他自己再改。

能看懂「月色真美,适合刺猹」,这个必应厉害了。

图源:ccskai

不同于ChatGPT的没主见,必应AI在坚持观点方面做得很好。

图源:ccxkai

当被「ccskai」突然表白时,必应受宠若惊,使用了大量的流汗黄豆(大概是中文数据集的特色吧😅)。可以脑补一下日本动漫中那种羞涩挠头说着「いやあ~いやあ~」的男生。

OMG,这也太会卖萌了吧……

知友「hez2010」发现,必应配合Edge的网页上下文理解能力太强了。

图源:hez2010

它不仅推测出了正确的label,还知道如何使用GitHub搜索来筛选,让网友大呼震撼。

图源:hez2010

「知友钛科闹了技Tech」表示,新必应相比于之前ChatGPT有两个很恐怖的提升:

1.接入网络了,可以获取实时信息

2.可以通过我的提示和网络上的消息来自我验证,还能看到纠错后的正确结果

所以再用一段时间,训练多了,反馈多了,准确率会越来越高。

「钛科闹了技Tech」问了必应「Time获得了中国星际有史以来第一个冠军」这个消息,必应并不知道。

图源:钛科闹了技Tech

可以看出,必应虽然联网了,但对最新消息的收录仍有一定的门槛。但是,它可以纠错了。

下图可以看出,必应的纠错能力很强大。

图源:钛科闹了技Tech

「知友钛科闹了技Tech」问了必应一个他自己都存疑的内容。

图源:钛科闹了技Tech

结果必然居然正面回答了,「知友钛科闹了技Tech」当场表示:「它带给我的震撼已经无可言表……」

图源:钛科闹了技Tech

知友「永遇乐」也说,「体验有点恐怖。本来以为只是简单的给bing加个chatgpt访问借口,没想到是直接汇总你问题的查询结果,以人话给你说明并标记参考资料。这比普通搜索或不知道信息来源的原生ChatGPT强多了。」

随便问个问题,都可以直接查看答案信息来源(图源:永遇乐)

答主「幽幽夜」表示,新必应比起ChatGPT更快、更稳定。

写的代码段质量很高,还可以自动解析代码内容。

图源:幽幽夜

以后用ChatGPT和不用ChatGPT的程序员,或许效率会有天壤之别了。

图源:幽幽夜

新必应vs.ChatGPT

下面,咱们来看看一位外国网友的测评。他把新必应和ChatGPT、老必应、谷歌、Bard都做了一番全方位的比较。

众所周知,ChatGPT的训练数据只有2021年之前的。

而新必应不仅可以访问网页和最新的数据,同时还能在结果中给出参考资料的来源。

举个例子,你要是问ChatGPT推特的现任CEO是谁,它肯定答不上来。但新必应就可以脱口而出。

此外,新必应还将搜索提示一并加到了聊天框和精选摘要里。

不管用户点击哪一个,都可以体验到更具沉浸感的聊天体验。

新必应vs.老必应

新必应与老必应的核心搜索结果实际上是相同的,唯一的区别是聊天机器人的存在。

过去的十几年,必应的目标是让核心搜索结果达到谷歌的标准。但在这之前,必应需要改进的地方还有很多。

尤其在广告方面,微软这些为了年确保收益采用了太多的「黑科技」。

具体而言,老必应存在有3个核心问题:

  • 广告数量过多:必应会在搜索结果中展示5个广告,而谷歌最多是4个。
  • 广告差异极小:必应故意将搜索结果之间的差异做得很小,用户难以区分词条之间的差别,很可能会意外点中广告。
  • EMD权重过大:不可否认,搜索结果中必应给予精确匹配占比很大,可以说已经到了泛滥的地步。

而新必应在AI的加持下,看起来确实更具吸引力。

当然,目前这个功能还存在一些bug。

比如下面就是没有被触发时候的样子——AI就是把其中一个结果「框起来」了而已。

新必应vs.谷歌

以必应现在的市场份额,即便是搜索结果有了AI的加持,也远不足以推翻谷歌的地位。

然而,万万没想到到的是,谷歌在首次发布Bard时,就打了自己的脸。

注意看,Bard的其中一个回复是「JWST拍摄了我们太阳系以外的行星的第一批照片」,然而这并不准确。

实际上,有史以来第一张关于太阳系以外的行星,也就是系外行星的照片,是在2004年由智利的甚大射电望远镜(Very Large Array, VLA)拍摄的。

这颗系外行星被称为2M1207b,大小约为木星的五倍,位于离地球约170光年处。

是的,正如新必应给出的结果所说的那样。

显然,在目前的形式下,新必应的确有能力从谷歌手里夺走一些潜在的流量。

新必应vs.Bard

谷歌发布的Bard,其重点是在于有NORA(没有一个正确答案)的查询,这似乎与新必应使用的方法不同。

在发布会上,谷歌重点强调了Bard在处理NORA(没有一个正确答案)问题时的能力。

在谷歌给出的示例中,Bard提到最好的星座是猎户座、仙后座、大熊座和飞马座。

而新必应则详细介绍了一组不同的建议,包括金牛座、剑鱼座,以及其他几个谷歌没有提到的星座。

至于哪个答案「更好」,基本上全凭大家都主观判断,不过从传统搜索的使用体验上来看,谷歌通常会更胜一筹。

总结一下:

  • 新必应有近乎实时(有延迟)的网络访问,可以找到ChatGPT没见过的数据。
  • 新必应并没有取代精选摘要等SERP功能,而是将聊天功能作为一个扩展。在部分情况下,新必应会提供「双倍」的答案,让页面显得非常混乱。
  • 老必应还有很长的路要走,毕竟有很多阻碍着它与谷歌竞争的问题,至今都还没得到解决。
  • 在Bard给出的建议里,谷歌并没有给出作为参考的信息来源,而新必应则有大量的链接可供用户点击。

目前来说,虽然在搜索引擎中加入由AI驱动的聊天结果这件事还处于初期阶段,但进展迅速。

而这些变化对传统搜索所产生的影响,也不一定是负面的。

毕竟,每隔几年都会有人提出这样那样的担忧,但搜索行业却仍在快速地增长。

参考资料:

https://www.zhihu.com/question/583588366

https://dkb.blog/p/bing-ai-cant-be-trusted

https://brodieclark.com/new-bing-review/

特别鸣谢:

「ccxkai」https://www.zhihu.com/question/583588366/answer/2889780355

「钛科闹了技Tech」https://www.zhihu.com/question/583588366/answer/2891347604

「hez2010」https://www.zhihu.com/question/583588366/answer/2892199436

「永遇乐」

https://www.zhihu.com/question/583588366/answer/2892200163

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 总结一下:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档