试用Claude3

1 简介

好消息是,2024 年 3 月 4 日发布了 Claude3,据传比 GPT-4 更好,snooet 版本可以免费试用,坏消息是我们这儿不能用。

在官网注册时,需要选择国家并使用手机接收短信验证码。而在选项中没有中国这个选项。即使成功注册了账号并申请了 API 密钥,免费版本仍需要绑定信用卡才能使用。绑定信用卡也需要接收短信验证,网上说每个手机号只能注册一次,所以似乎也无法短信接收平台。(如果你找到了注册方法,请私信告诉我)

虽然无法通过 API 调用并将其添加到我们的工具中,但可以通过亚马逊云来免费体验一下。

2 Claude3

2.1 三个模型

Claude 3 共发布了三个模型:

  • Claude 3 Opus:最强大的模型,在高度复杂的任务上提供最先进的性能,并展示流畅性和类似人类的理解。
  • Claude 3 Sonnet:在智能和速度之间最平衡的模型,是企业工作负载和规模化 AI 部署的绝佳选择
  • Claude 3 Haiku:最快、最紧凑的模型,旨在实现近乎即时的响应能力和模仿人类交互的无缝 AI 体验

2.2 主要特点

这次升级的主要特点包含:

  • 多语言功能:Claude 3 提高了非英语语言的流利度,支持翻译服务和全球内容创建等用例。
  • 视觉和图像处理:所有 Claude 3 模型都可以处理和分析视觉输入、从文档中提取内容、处理 Web UI、生成图像元数据等。
  • 可操纵性和易用性:Claude 3 更擅长遵循提示。
  • 内容更新:Claude 3 系列将定期接收更新,以增强性能、扩展功能并解决任何已发现的问题。

2.3 价格

|400

|400

Claude 3 OpusClaude 3 SonnetClaude 3 HaikuClaude 2.1Claude 2Claude Instant 1.2
Cost (Input / Output per MTok^)15.00/75.003.00/15.000.25/1.258.00/24.08.00/24.00.80/2.40
Training data cut-offAug 2023Aug 2023Aug 2023Early 2023Early 2023Early 2023

2.4 资料

主页:https://www.anthropic.com/

文档:https://docs.anthropic.com/claude/docs/models-overview

3 使用方法

3.1 界面调用

Anthropic 的 Claude 3 Sonnet 模型在亚马逊 Bedrock 平台上可以免费试用,扫码登录:

https://portal.cloudassist-beta.sign-up.china.aws.a2z.com/demo/qrcode?trk=community

(顺便提一句:亚马逊的云实验环境实在很好用)

进入后,依次操作:

  • 点击:" 限时试用 "
  • 点击:尝试 RedRock" 入门 "
  • 点击:右侧 ANTHROPIC " 请求模型访问权限 "
  • 点击:右上 " 管理模型访问权限 "
  • 点击:ANITHROPIC 右侧“”提交应用场景详细信息”如下,填好后稍等刷新,可以看到成功获取到访问权限。

|300

|300

  • 点击:左侧聊天,把模型切换成 Claude3 sonnet 即可开始聊天

3.2 python 程序调用

用法非常简单,和 gemini,openai gpt 差不多,就不在此 demo 了。

4 测试

4.1 编写代码

  • 提问:给我写一段 android 音乐播放器的界面代码。
  • 回答:返回 layout xml 看着还行,没有 java 代码,还包含一些注意事项。
  • 讨论:如果细化一下需求,大问题拆成小问题再问,效果应该还不错。

4.2 知识性问题

  • 提问:请介绍一下莫言。
  • 回答:回答正确。
  • 讨论:还提问了另一些知识性问题,感觉知识性内容 Claude3 和 Genimi 比 GPT-4 明显更好。

4.3 翻译问题

  • 提问:将葳文翻译成中文:ང་རང་གིས་གཙོ་སྒྲུབ་བྱས་པའི་དབང་སྡུད་གསོལ་འདེབས་ཀྱི་ཚོམ་འདིར་ཕེབས་པར་དགའ་བསུ་ཞུ། ཁོམ་སྐབས་དང་བསྟུན་ནས་དབང་སྡུད་གསོལ་འདེབས་ཉུང་ཙམ་གསུང་རོགས་ཞ
  • 回答:基本正确,沟通方式很友好,可能由于使用大量人工标注 instruct 引导学习。
  • 分析:后来又翻译了一段颂词,藏文相对小语种,我觉得相比之下,Claude 和 Gemini 差不多,gpt4 略差一点,gpt3.5 几乎没法用。

4.4 阅读理解

  • 提问:请从原文中提取合同核心条款:“回购权”," 股权锁定 "," 优先认购权 ",....,对应的数据块,用原文回答。原文如下:……(上下文支持足够长,可以在聊天中加原文)
  • 回答:Claude3 答出了核心条款所在章节,但并没有用原文回答,试了几种问法,均没有用原文回答,可能是模型对输出量做了限制。如果问单个条款,在答案不太长的情况下,可用原文回答。
  • 提问:从原文找:" 股权锁定 " 对应的数据块,用原文回答。
  • 回答:返回了我想要的完整数据块,及一些总结性文本,总结得比我理解得还好呢。
  • 反馈时间:上传 2W 字,反馈时间 20-30 秒。
  • 讨论:提问内容属于相对专业领域,模型能理解:反摊薄条款=反稀释,优先清算权=优先分配权,以及正文内容与标题的关系,可见 Claude3 理解能力确实强;但没有完全按要求回答,偶尔会产生一些幻觉。相对 GPT3.5/4 好很多。
  • 分析:在这个应用场景里,推荐用规则提取能提取的内容,用模型处理比较复杂的内容,以平衡性价。



4.5 总结

个人体会,不一定对。

  • 我感觉 Gemini,Claude3,GPT-4 基本是一个层次的,效果比 GPT-3.5 好很多。
  • 未来可能不会再有一大独大的情况了。
  • 模型对比:
    • GPT-4 各方面比较均衡,生态完善,工具链太熟悉,切换也有成本。
    • Gemini 知识能力比较强,更深入专业领域,小伙伴拿他当百度百科用。
    • Claude 理解能力比较好,更深入专业领域,目前没法在程序中调用。
  • 最终选型还是要看价格,充值难度,易得性,响应时间,效果,取平衡。
  • 几个模型对单一问题的回答都还不错,但对于复杂问题可能还需要加思维链和 RAG 来做。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/519659.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯(3.7)

P1102 A-B 数对 import java.util.Scanner; public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);int n sc.nextInt();int c sc.nextInt();int[] res new int[n1];for(int i1;i<n;i)res[i] sc.nextInt();int sum 0;for(i…

吴恩达深度学习笔记:神经网络的编程基础2.1-2.3

目录 第一门课&#xff1a;神经网络和深度学习 (Neural Networks and Deep Learning)第二周&#xff1a;神经网络的编程基础 (Basics of Neural Network programming)2.1 二分类(Binary Classification)2.2 逻辑回归(Logistic Regression) 第一门课&#xff1a;神经网络和深度学…

相机标定实验

相机标定 文章目录 相机标定1 ROS标定1.1安装标定程序1.2 下载标定板1.3 标定1.4 标定结果 2 Kalibr相机标定2.1 下载官方提供的标定板2.2 自定义标定板2.3 cam数据录制2.4 标定2.5 输出结果 3 MATLAB标定3.1 打开工具3.2 添加标定板图片3.3 设置标定参数3.4 生成标定结果3.5 标…

【Linux篇】gdb的使用

&#x1f49b;不要有太大压力&#x1f9e1; &#x1f49b;生活不是选择而是热爱&#x1f9e1; &#x1f49a;文章目录&#x1f49a; 1. 背景知识2. 使用 1. 背景知识 1. 程序发布的方式有两种&#xff0c;debug模式和release模式 2. Linux下&#xff0c;gcc和g编译生成的可执行…

springboot实现多线程开发(使用@Async注解,简单易上手)

根据springboot的核心思想便捷开发&#xff0c;使用多线程也变得简单起来&#xff0c;通过一下几个步骤即可实现。 核心注解 EnableAsync将此注解加在启动类上&#xff0c;使项目支持多线程。 Async 使用我们的Async注解在所需要进行多线程的类上即可实现。 配置线程池 …

腾讯云服务器和阿里云服务器价格测评_2024年费用大PK

2024年阿里云服务器和腾讯云服务器价格战已经打响&#xff0c;阿里云服务器优惠61元一年起&#xff0c;腾讯云服务器61元一年&#xff0c;2核2G3M、2核4G、4核8G、4核16G、8核16G、16核32G、16核64G等配置价格对比&#xff0c;阿腾云atengyun.com整理阿里云和腾讯云服务器详细配…

WebStorm安装教程 【2023年新版安装图解】

​Webstorm相关介绍 WebStorm是一款功能强大、易用且高效的开发工具&#xff0c;为Web开发者提供了全方位的支持。无论是初学者还是经验丰富的开发者&#xff0c;都能从中受益。如果你想要提高开发效率、减少出错概率&#xff0c;不妨试试WebStorm&#xff0c;它将成为你的得力…

WEB自动化测试----------Webdriver API 的使用

&#x1f525; 交流讨论&#xff1a;欢迎加入我们一起学习&#xff01; &#x1f525; 资源分享&#xff1a;耗时200小时精选的「软件测试」资料包 &#x1f525; 教程推荐&#xff1a;火遍全网的《软件测试》教程 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1…

动态规划(算法竞赛、蓝桥杯)--乱杀的状态压缩DP

1、B站视频链接&#xff1a;E25 状态压缩DP 小国王_哔哩哔哩_bilibili 题目链接&#xff1a;[SCOI2005] 互不侵犯 - 洛谷 #include <bits/stdc.h> using namespace std; int n,k;//棋盘行数、国王总数 int cnt;//一行合法状态的个数 int s[1<<12];//一行合法状态…

GCN 翻译 - 2

2 FAST APROXIMATE CONVOLUTIONS ON GRAPHS 在这一章节&#xff0c;我们为这种特殊的的图基础的神经网络模型f(X, A)提供理论上的支持。我们考虑一个多层的图卷积网络&#xff08;GCN&#xff09;&#xff0c;它通过以下方式进行层间的传播&#xff1a; 这里&#xff0c;是无…

调用Mybatis plus中的saveBatch方法报找不到表的问题

1.问题现象 在用Mybatis plus开发的项目中&#xff0c;用自带的API批量保存的方法saveBatch操作时&#xff0c;发现报没有找到表的错误。 错误日志截图如下&#xff1a; 表实际是存在的&#xff0c;且发现其他的方法都没有问题&#xff0c;包括save、update等单个的方法&…

tomcat搭建个人博客 实现动静分离

jar包相关 .war&#xff1a;WebApp打包,类zip格式文件,通常包括一个应用的所有资源,比如jsp,html,配置文件等 .jar&#xff1a;EJB类文件的打包压缩类zip格式文件&#xff0c;,包括很多的class文件, 网景公司发明 .rar&#xff1a;资源适配器类打包文件&#xff0c;目前已不常…