gpt-4击败claude3,成为最强AI大模型

最近,gpt-4再次击败claude3,重新夺回全球最强AI大模型宝座!

在最近的AI基准测试中,OpenAI刚刚发布的GPT-4-Turbo-2024-04-09版本,实现了对Claude3 Opus的大幅领先,重新夺回了全球AI霸主的地位:

几个月前,Claude3 Opus成功超越了GPT-4,吸引了全球网友纷纷离开GPT,投入Claude3的怀抱,并分享着Claude3带来的惊艳体验。

然而,如今OpenAI再次展示了其强大的实力,证明GPT依然是AI领域的佼佼者!

ecbce6f84612ff3c48e5146f8fa1f4b0.jpeg

对于想要亲自体验并比较GPT-4 Turbo与其他LLMs 性能的用户来说,AskManyAI网站是一个很好的办法。0bf59b06fc0435e65125d3ad7ef1b0d0.jpeg

附AskManyAI地址(GPT-4、Claude3、Gemini都是最新版本):

https://askmanyai.cn


值得一提的是,AskManyAI有个独特的AI混战模式,输入一个问题,可以指定多个最强的AI同时给你回答。同时选中GPT-4(GPT-4-Turbo-2024-04-09版本)、Claude3 Opus、Kimi、Gemini Pro,各个AI大模型抢着回答,是不是很爽!

4b5a073146deec0ea00a193c1eef6f6f.jpeg

好了,话不多说,我们这就开始测评了!

最新版GPT-4.5-Turbo 大战 Claude 3 Opus

代码能力测试

首先我们来看看代码debug方面的表现:

5fa2414ecb1f59f7c3361dff6b04ab05.jpeg

293468d4184da60d2ef461f87aa86636.jpeg

4bf736c5e87bef4057198a35f55e3ac1.jpeg

这是一个很隐蔽的bug,Claude 3 Opus完全没找到bug在哪,其实这个bug,以前的GPT-4也找不到。但是刚刚更新的这个GPT-4.5-Turbo竟然找到了bug!

而且给到了非常正确的修复bug后的代码!

简直惊呆我了,这是第一个能修复这个bug的AI。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

科研学术能力测试

然后我们来看看专业学术问题的表现。

我们这次加大难度,上传一个生物样品图片给AI:

6267e6146b8ee72caa29aff38dc1185d.jpeg

然后我们在AskManyAI网站同时选中Claude、GPT和Gemini这三个地表最强的多模态AI,看他们对这个图片分析的结果:

2ad6bfa66e61d3d2c67a1fea984c38d3.jpeg

这个case在旧版的GPT-4-Turbo里是个回答错误的badcase,当时明显不如Claude-3 Opus。但几天前的GPT-4-Turbo更新后,竟然回答对了!

不得不表扬下,AskManyAI这个网站的更新速度也真的够快啊!跟官方基本同速了。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

我们再换一个专业问题:

d7fd06368be92bd6fac801e7f4c66ef6.jpeg

0aec92f46fe13b617f1ffca0eb07dbfb.jpeg

a9789965839831898c001bab094a6165.jpeg

0ec46c27618296b8844b08b7ad53b74d.jpeg

关于Sora技术原理的解释,所有的AI中,只有最新的GPT-4没有出现知识性的错误,Kimi和Gemini的错误是最离谱的,竟然说Sora是GAN的架构。。。而Claude-3的视频片段选择这个地方的讲解出现了错误——Sora是生成式的,不是检索式的。

我猜测这可能是因为只有GPT-4的知识库已经更新到了2024年的4月份。而Sora是2月份刚发布的,所以只有GPT-4学到了这方面的知识。

最新版GPT-4完胜!

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

营销能力测试

这次测试加大难度,直接丢给AI一个产品文档PDF,让他去生成一篇营销文案和搜索SEO的标题。

0cf57b31f06f90a25497b7c0d2467a86.jpeg

同样,这次GPT-4完胜!

AI写作能力测试

最后测试下AI写作能力!

4327677cb6a82a548e6407a2f03b4517.jpeg

0c958aa406bd96fc756879ffb744c38e.jpeg

f3e8892b3ad4105800ff5cc7bb8ea10f.jpeg

e4d0a53590fc3104baf25109d43970a2.jpeg

a7134be62014fc3c2b4b32850464e80d.jpeg

d0836fda89b773c187735cd49685a1b8.jpeg

cd4474e12954ec818fe102b74c609448.jpeg

写作的测试结果就要见仁见智了,每个人的看法都可能不一样。

这里面我最喜欢的是GPT-4和Claude-3写的文章,但Gemini Pro的写作速度非常快,不到5秒就写完了全篇。而GPT-4和Claude-3则写了一分钟不止。

附AskManyAI地址(以上案例可在AskManyAI直接复现):

https://askmanyai.cn

好了,今天的评测就到这里了。你们更喜欢哪个AI呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/623772.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

密码学 | 椭圆曲线数字签名方法 ECDSA(下)

目录 10 ECDSA 算法 11 创建签名 12 验证签名 13 ECDSA 的安全性 14 随机 k 值的重要性 15 结语 ⚠️ 原文:Understanding How ECDSA Protects Your Data. ⚠️ 写在前面:本文属于搬运博客,自己留着学习。同时,经过几…

恶意软件逆向工程:Ghidra 入门 -第一部分

在逆向工程领域有许多优秀的工具可以使用(比如IDA Pro和OllyDbg),但现在我们有一个新的选择-Ghidra。Ghidra是由美国国家安全局(美国主要的间谍机构,负责开发Stuxnet恶意软件和EternalBlue的机构)开发的&am…

倍增法学习

这里i为开始下标,j是2的次幂

动态IP代理API是什么?怎么用?

“动态”意味着每次连接或每隔一段时间,用户的IP地址都会发生改变。由于IP地址的不断变化,用户可以避免因频繁访问同一网站而导致的IP被封锁的问题。API叫做应用程序接口,是一种让软件之间相互通信的接口。API允许用户通过编程方式来调用动态…

如何学习VBA_3.2.20:DTP与Datepicker实现日期的输入

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的劳动效率,而且可以提高数据处理的准确度。我推出的VBA系列教程共九套和一部VBA汉英手册,现在已经全部完成,希望大家利用、学习。 如果…

保护你的数据隐私!新技术将实现绝对安全的「量子云计算」

听说过物质-光子混合实现可验证的盲量子计算(blind quantum computing)吗? "盲量子计算"是一种使用户能够远程利用量子计算服务商的量子设备执行计算的模式。这一技术可能使数百万个人和企业安全地接入下一代量子计算机&#xff0c…

Python编程之旅:深入探索强大的容器——列表

在Python编程的世界中,容器(Containers)是一种用于存储多个项目的数据结构。其中,列表(List)是最常用且功能强大的容器之一。无论是初学者还是资深开发者,掌握列表的使用方法和技巧都是提升Pyth…

Linux/Cronos

Cronos 天热了,什么也不想干,拿以前的来凑个数 Enumeration Nmap 扫描发现对外开放了22,53,80端口,使用nmap详细扫描这几个端口 ┌──(kali㉿kali)-[~/vegetable/HTB/cronos] └─$ nmap -sC -sV -p 22,53,80 -oA…

【Git教程】(十二)工作流之项目设置 — 何时使用工作流,工作流的结构,项目设置概述、执行过程及其实现 ~

Git教程 工作流之项目设置 1️⃣ 何时使用工作流2️⃣ 工作流的结构3️⃣ 概述4️⃣ 使用要求5️⃣ 执行过程及其实现5.1 基于项目目录创建一个新的版本库5.2 以文件访问的方式共享版本库5.3 用 Git daemon 来共享版本库5.4 用 HTTP 协议来共享版本库5.5 用 SSH 协议来共享版…

AI 业务应用经验:以零一万物的万知 AI 创作为例

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

Redis集群机制及一个Redis架构演进实例

Replication(主从复制) Redis的replication机制允许slave从master那里通过网络传输拷贝到完整的数据备份,从而达到主从机制。为了实现主从复制,我们准备三个redis服务,依次命名为master,slave1&#xff0c…

win10 64位装三菱PLC软件出现oleaut32.dll拒绝访问

win10 64位装 三菱PLC软件GX works2出现以下情况:以下文件没有自注册或撤消注册 c:/Windows/SysWOW64/oleaut32.dll拒绝访问 经过百度说是兼容问题 解决方案:在安装包启动图标上右键-兼容性疑难解答-尝试建议的设置-测试程序。 点击测试程序后setup正常…