测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus

测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus

  • 0. 引言
  • 1. 测试 Claude 3 Opus

0. 引言

今天测试一下 Anthropic 发布的 Claude 3 Opus。

3月4日,Anthropic 宣布推出 Claude 3 型号系列,该系列在广泛的认知任务中树立了新的行业基准。该系列包括三款最先进的型号,按功能升序排列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续型号都提供越来越强大的性能,允许用户为其特定应用选择智能、速度和成本的最佳平衡。

Opus 和 Sonnet 现在可以在 claude.ai 和 Claude API 中使用,后者现已在 159 个国家/地区正式发布。

Claude 3 模型系列

在这里插入图片描述
以下是 Claude 3 型号与同行在多个性能基准 [1] 上的比较
在这里插入图片描述
强大的视觉能力

Claude 3 型号具有与其他领先型号相媲美的复杂视觉功能。它们可以处理各种视觉格式,包括照片、图表、图形和技术图表。我们特别高兴能为我们的企业客户提供这种新模式,其中一些客户拥有多达 50% 的知识库以各种格式编码,例如 PDF、流程图或演示幻灯片。

在这里插入图片描述
refer: https://www.anthropic.com/news/claude-3-family

1. 测试 Claude 3 Opus

题目是我之前写的 让 OpenAI GPT4 出 10 道题测试其他开源大语言模型。

无图无真相,直接上截图,这样大家也可以自行判断一下效果。

import anthropicclient = anthropic.Anthropic(# defaults to os.environ.get("ANTHROPIC_API_KEY")# api_key="my_api_key",
)def chat(content):return client.messages.create(model="claude-3-opus-20240229",max_tokens=1000,temperature=0,messages=[{"role": "user", "content": content}])response = chat("<your question>")
print(response.content[0].text)
  1. 一个矩形的长是10厘米,宽是5厘米,求它的面积。
    在这里插入图片描述
  2. 中国的四大发明是什么?
    在这里插入图片描述
  3. 世界上最高的山是什么?
    在这里插入图片描述
  4. 牛顿第二运动定律是什么?
    在这里插入图片描述
  5. 水的化学式是什么?
    在这里插入图片描述
  6. DNA的全称是什么?
    在这里插入图片描述
  7. 《红楼梦》的作者是谁?
    在这里插入图片描述
  8. 太阳系中最大的行星是哪一个?
    在这里插入图片描述
  9. 乒乓球起源于哪个国家?
    在这里插入图片描述
  10. 世界上第一台电脑是什么?
    在这里插入图片描述
    完结!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/520910.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NLP_文本数据分析_3(代码示例)

目标 了解文本数据分析的作用.掌握常用的几种文本数据分析方法. 一、 文件数据分析介绍 文本数据分析的作用: 文本数据分析能够有效帮助我们理解数据语料, 快速检查出语料可能存在的问题, 并指导之后模型训练过程中一些超参数的选择. 常用的几种文本数据分析方法: 标签数量分…

Web——HTML

一.HTML概述 超文本标记语言&#xff08;英语&#xff1a;HyperText Markup Language&#xff0c;简称&#xff1a;HTML&#xff09;是一种用于创建网页的标准标记语言。可以使用 HTML 来建立自己的 WEB 站点&#xff0c;HTML 运行在浏览器上&#xff0c;由浏览器来解析。 二.…

图书推荐|Windows Server 2022 系统与网站配置实战

讲述桌面体验、Server Core/Nano Server&#xff0c;容器与云系统的配置 1 本书内容 《Windows Server 2022 系统与网站配置实战》秉持作者一贯理论兼具实践的写作风格&#xff0c;以新版的Windows Server 2022系统与网站配置实践为主题&#xff0c;辅以大量的实例演示&#x…

finallShell上传文件失败?

上传了一部分就直接报错&#xff0c;导致centos服务器还连接不上了&#xff0c; 后来我用网上的破解版finallshell&#xff0c;也是出现同样的情况&#xff0c; 最后没办法我用的网上推荐的另外一款ssh的客户端工具才可以上传成功。 有遇到同样情况的小伙伴&#xff0c;可以…

【小黑送书—第十一期】>>如何阅读“计算机界三大神书”之一 ——SICP(文末送书)

《计算机程序的构造和解释》&#xff08;Structure and Interpretation of Computer Programs&#xff0c;简记为SICP&#xff09;是MIT的基础课教材&#xff0c;出版后引起计算机教育界的广泛关注&#xff0c;对推动全世界大学计算机科学技术教育的发展和成熟产生了很大影响。…

git revert 撤回之前的几个指定的提交

文章目录 Intro操作命令-n 选项 参考 Intro 在开发过程中&#xff0c;有的时候一开始只是一个小需求&#xff0c;可以改着改着事情超出了控制&#xff0c;比如说我一开始只是想调整一个依赖包的版本&#xff0c;可是改到后来类库不兼容甚至导致项目无法启动。 这个时候我就想&…

音频库及分析软件介绍

搞音频的兄弟必须要看一下的&#xff0c;俗话说&#xff0c;工欲善其事必先利其器&#xff0c;好的音频分析软件&#xff0c;对于音频分析工程师来讲&#xff0c;可谓是非常重要的&#xff0c;下面由小编介绍一下&#xff1a;

Gafana Redis Overview dashboard

1. 简介 根据提供的 Redis 监控仪表盘 JSON 文件,包含的监控指标及其简要描述如下: redis_uptime_in_seconds: Redis 实例的运行时间(秒)。 redis_connected_clients: 当前连接到 Redis 实例的客户端数量。 redis_memory_used_bytes: Redis 实例使用的内存量(字节)。 redis_m…

利用CesiumJS开发模拟飞机飞行的应用(三、飞行动画)

上一节介绍了利用CesiumJS开发模拟飞机飞行的应用(添加飞行轨迹),本节介绍如何在上节基础上添加模拟飞行 飞行动画效果实现 我们将创建一个 SampledPositionProperty 来存储每个位置以及时间戳。源数据不包含每个样本的时间戳&#xff0c;但我们知道航班号为 SK936&#xff…

代码训练LeetCode(4)字母异位词

代码训练(4)LeetCode之字母异位词 Author: Once Day Date: 2024年3月6日 漫漫长路&#xff0c;才刚刚开始… 全系列文章可参考专栏: 十年代码训练_Once-Day的博客-CSDN博客 参考文章: 242. 有效的字母异位词 - 力扣&#xff08;LeetCode&#xff09;力扣 (LeetCode) 全球极…

使用腾讯云快速搭建WordPress网站流程详解

专栏系列文章&#xff1a; WordPress建站主题美化系列教程https://blog.csdn.net/seeker1994/category_12184577.html 一文搞懂WordPress是什么&#xff1f;为什么用它建站&#xff1f;怎么安装与部署&#xff1f; 初次安装WordPress后如何进行网站设置&#xff08;主题安装、…

分析:如何多线程运行测试用例

这是时常被问到的问题&#xff0c;尤其是UI自动化的运行&#xff0c;过程非常耗时&#xff0c;所以&#xff0c;所以多线程不失为一种首先想到的解决方案。 多线程是针对的测试用例&#xff0c;所以和selenium没有直接关系&#xff0c;我们要关心的是单元测试框架。 unittest …