ChatGPT or BingChat

你相信我们对大模型也存在「迷信权威」吗?

ChatGPT 的 GPT-4 名声在外,我们就不自觉地更相信它,优先使用它。但我用 ChatALL 比较 AI 大模型们这么久,得到的结论是:

ChatGPT GPT-4 在大多数情况下确实是最强,但综合费用、访问难度、封号风险等条件,它就不是了。而大多数人在用的 ChatGPT 3.5,就更不是了。

那么最强的是谁呢?Bing Chat!先列举几个客观事实,再做主观分析。

ChatGPT 3.5ChatGPT 4Bing Chat
费用免费每月 20 美元免费
注册国外手机号国外手机号任意邮箱
封 IP
封帐号
浏览器兼容只 Edge

从上表可以看出,除了浏览器兼容这一项以外,都是 Bing Chat 更好。

下面再主观分析下模型的效果,毕竟这个是王道。

先透露一个小道消息。据说,Bing Chat 比 ChatGPT 更早使用了 GPT-4 模型。甚至可能从第一天就是 GPT-4。但为什么没有人说 Bing Chat 比当时的 ChatGPT 3.5 更强?大概就是明星光环导致的吧。

Bing Chat 的三个风格:创造力、平衡和精确,从一开始时就不是同一个模型设了不同的 temperature 那么简单。

起初,创造力的模型是 h3imaginative,平衡是 harmonyv3,精确是 h3precise。从命名看,平衡就很独特。后来不知道某一天「平衡」变成了 galileo(伽利略),更独特了。

用 chatall.ai 同时发 prompt 给它们,能明显感觉到「平衡」的生成速度更快。这也说明基础模型和另两个大有不同。可能是 GPT-3.5,也可能是 GPT-4 最新的蒸馏调优版(就像现在的 3.5 比最早的 3.5 快很多一样)。后者的可能性更大。

也就是说,Bing Chat 就是免费的 GPT-4 了,何必还费劲去鼓捣 ChatGPT 呢?

如果以上分析还不够说服力,那么我们来看客观数据。

下面是 chatall.ai 五月份的数据统计:

解释下数据:

  1. 发送、加亮、删除和拷贝四列是用户对大模型做对应操作的次数,「率」就顾名思义了
  2. 「加亮」是突出显示,表示这个结果好。但因为 ChatALL 现在长期保存数据的能力还不够,这个操作的意义不大,不是很能说明问题
  3. 「删除」表示这条结果太差了,不想再看到了。但因为 ChatALL 这段时间在 Bing Chat 上出了不少 bug,很可能有大量出错信息被删除
  4. 「拷贝」表示这条结果我打包带走拿去用了,是另一种认可,且可能是最强的认可

坦率说,因为基数不够大,以及各种缺陷,这个数据只能参考。但考虑到 ChatGPT 的光环加持,Bing Chat 受 ChatALL bug 的负面影响,还是可以说明 Bing Chat 和 ChatGPT 4 效果上是伯仲之间的。

 转载:https://zhuanlan.zhihu.com/p/633148476

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/67076.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

推断统计(独立样本t检验)

这里我们是采用假设检验中的独立样本t 检验来比较两个独立正态总体均值之间是否存在显著性差异,以比较城市与农村孩子的心理素质是否有显著差异为例 。 这里我们首先是假设城市孩子与农村孩子心理素质无显著差异,但是此时方差是否齐性是未知的&#xff0…

使用 AndroidX 增强 WebView 的能力

在App开发过程中,为了在多个平台上保持一致的用户体验和提高开发效率,许多应用程序选择使用 H5 技术。在 Android 平台上,通常使用 WebView 组件来承载 H5 内容以供展示。 一.WebView 存在的问题 自 Android Lollipop 起,WebVie…

了解 Langchain️是个啥?:第 1 部分

一、说明 在日常生活中,我们主要致力于构建端到端的应用程序。我们可以使用许多自动 ML 平台和 CI/CD 管道来自动化 ml 管道。我们还有像Roboflow和Andrew N.G.的登陆AI这样的工具来自动化或创建端到端的计算机视觉应用程序。 如果我们想在OpenAI或拥抱脸的帮助下创…

文本挖掘 day5:文本挖掘与贝叶斯网络方法识别化学品安全风险因素

文本挖掘与贝叶斯网络方法识别化学品安全风险因素 1. Introduction现实意义理论意义提出方法,目标 2. 材料与方法2.1 数据集2.2 数据预处理2.3 关键字提取2.3.1 TF-IDF2.3.2 改进的BM25——BM25WBM25BM25W 2.3.3 关键词的产生(相关系数) 2.4 关联规则分析2.5 贝叶斯…

vue学习笔记

1.官网 v2官网 https://v2.cn.vuejs.org/ v3官网 https://cn.vuejs.org/ 2.vue引入 在线引入 <script src"https://cdn.jsdelivr.net/npm/vue2.7.14/dist/vue.js"></script> 下载引入(下载链接) https://v2.cn.vuejs.org/js/vue.js 3.初始化渲…

VictoriaMetrics部署及vmalert集成钉钉告警

1、部署VictoriaMetrics cd /usr/local wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.65.0/victoria-metrics-amd64-v1.65.0.tar.gz mkdir victoria-metrics && tar -xvzf victoria-metrics-amd64-v1.65.0.tar.gz && \ mv …

JVM 内存结构

1、方法区&#xff08;线程共享&#xff09; 存储静态变量(静态方法、变量、代码块)、常量池、类信息 2、堆信息&#xff08;线程共享&#xff09; 存储实例对象&#xff0c;例如 new 出来的对象信息 A a1 new A() 3、虚拟机栈&#xff08;线程隔离&#xff09; 每个线程的都有…

试岗第一天问题

1、公司的一个项目拉下来 &#xff0c;npm i 不管用显示 后面百度 使用了一个方法 虽然解决 但是在增加别的依赖不行&#xff0c;后面发现是node版本过高&#xff0c;更换node版本解决。 2、使用插件动态的使数字从0到100&#xff08;vue-animate-number插件&#xff09; 第一…

(css)点击前隐藏icon图表 点击后显示

(css)点击前隐藏icon图表 点击后显示 效果 html <liv-for"(item,index) in sessionList":key"index"class"liClass":class"{ active: change2 index }"tabindex"2">...<el-tooltip class"item" effec…

蓝牙入耳式耳机老是滑出来,耳朵小适合戴什么样的骨传导耳机

最近体验了几款骨传导耳机&#xff0c;分享下我的使用感受。首先说一下为什么要选择骨传导耳机&#xff0c;我之前是使用入耳式耳机&#xff0c;戴久了耳朵会疼&#xff0c;而且晚上睡觉不能戴。于是就考虑骨传导耳机&#xff0c;因为骨传导耳机在传声的过程中不需要经过耳膜&a…

encoder-decoder

transformer的encoder-decoder 如果考虑一个由 2 个堆叠编码器和解码器组成的 Transformer&#xff0c;看起来会是这样的&#xff1a; 文章写的非常好&#xff1a;http://jalammar.github.io/illustrated-transformer/ 其中解码器中的自关注层的运行方式与编码器中的运行方式略…

解决电脑声音正常但就是某些游戏没声音问题

电脑声音正常&#xff0c;玩普遍游戏也正常&#xff0c;就有游戏不出声音 详细介绍经过&#xff0c;不喜欢的请直接跳 第三部分。 一、先说下起因现象。 1 大富翁11 没声音。 前段时间无聊怀旧就买了个大富翁11玩玩&#xff0c;近二十年前的老台式机正常无问题。后来想在性能…