LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

导读:2023年8月22日,OpenAI官方发布,开发者现在可以使用自己的数据定制适用于其用例的GPT-3.5 Turbo模型。GPT-3.5 Turbo的微调现在已经可用,GPT-4的微调将在今年秋季推出。此更新使开发者能够定制模型,以便为其用例提供更好的性能,并在规模上运行这些定制模型。初步测试显示,经过微调的GPT-3.5 Turbo版本在某些狭窄任务上可以与基础GPT-4水平的能力相匹配,甚至表现更好。与我们所有的API一样,发送到微调API的数据由客户拥有,不会被OpenAI或任何其他组织用于训练其他模型。

目录

微调用例

微调步骤

步骤1,准备您的数据

步骤2,上传文件

步骤3,创建微调作业

步骤4,使用经过微调的模型

安全性

定价

更新后的GPT-3模型


博客文章地址:GPT-3.5 Turbo fine-tuning and API updates

微调指南地址:https://platform.openai.com/docs/guides/fine-tuning

微调用例

自GPT-3.5 Turbo发布以来,开发者和企业一直在寻求将模型定制为为其用户创建独特和差异化的体验的能力。通过此发布,开发者现在可以运行监督式微调,以使该模型在其用例中表现更佳。

在我们的私人测试版中,微调客户已经能够在常见用例中显著提高模型性能,例如:
>> 改进的可控性:微调使企业能够更好地遵循指示,例如使输出更简洁或始终以给定语言回复。例如,开发者可以使用微调来确保模型在使用德语提示时始终以德语回复。
>> 可靠的输出格式:微调提高了模型一致格式化响应的能力 - 这对于需要特定响应格式的应用程序(如代码补全或组合API调用)来说是至关重要的。开发者可以使用微调来更可靠地将用户提示转换为可与其自己的系统一起使用的高质量JSON片段。
>> 定制音调:微调是磨练模型输出的定性感觉(如其音调)的好方法,使其更符合企业品牌的声音。具有可辨识品牌声音的企业可以使用微调使模型更符合其音调的一致性。

除了提高性能外,微调还使企业能够在确保类似性能的情况下缩短提示。使用GPT-3.5 Turbo进行微调还可以处理4k个标记 - 是我们先前微调模型的两倍。早期测试者通过将指令微调为模型本身,将提示大小缩小了高达90%,加快了每个API调用的速度并降低了成本。

当与提示工程,信息检索和函数调用等其他技术结合使用时,微调效果最佳。请查看我们的微调指南以了解更多信息。对于使用函数调用和gpt-3.5-turbo-16k进行微调的支持将在今年秋季后期推出。

微调步骤

步骤1,准备您的数据

{"messages": [{ "role": "system", "content": "You are an assistant that occasionally misspells words" },{ "role": "user", "content": "Tell me a story." },{ "role": "assistant", "content": "One day a student went to schoool." }]
}

步骤2,上传文件

curl https://api.openai.com/v1/files \-H "Authorization: Bearer $OPENAI_API_KEY" \-F "purpose=fine-tune" \-F "file=@path_to_your_file" 

步骤3,创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{"training_file": "TRAINING_FILE_ID","model": "gpt-3.5-turbo-0613"
}'

一旦模型完成微调过程,它就可以立即在生产中使用,并具有与基础模型相同的共享速率限制。

步骤4,使用经过微调的模型

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{"model": "ft:gpt-3.5-turbo:org_id","messages": [{"role": "system","content": "You are an assistant that occasionally misspells words"},{"role": "user","content": "Hello! What is fine-tuning?"}]
}'

我们还将在不久的将来推出微调用户界面,开发者可以更轻松地访问有关进行中的微调作业,已完成的模型快照等信息。

安全性

对我们来说,微调的部署非常重要。为了通过微调过程保留默认模型的安全功能,微调训练数据会通过我们的Moderation API和由GPT-4提供支持的调节系统进行传递,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两部分:初始培训成本和使用成本:
>> 训练:$0.008 / 1K个标记
>> 使用输入:$0.012 / 1K个标记
>> 使用输出:$0.016 / 1K个标记

例如,对于一个训练文件为100,000个标记的gpt-3.5-turbo微调作业,经过3轮训练,预期成本为$2.40

更新后的GPT-3模型

在7月份,我们宣布原始的GPT-3基础模型(ada,babbage,curie和davinci)将于2024年1月4日关闭。今天,我们将babbage-002和davinci-002作为这些模型的替代品提供,可以作为基础模型或微调模型。客户可以通过查询Completions API来访问这些模型。

这些模型可以使用我们的新API端点/v1/fine_tuning/jobs进行微调。此新端点提供分页和更多的可扩展性,以支持微调API的未来发展。从/v1/fine-tunes转换为更新的端点非常简单,更多详细信息可以在我们的新微调指南中找到。这会停用旧的/v1/fine-tunes端点,将在2024年1月4日关闭。

基础模型和微调GPT-3模型的定价如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/93483.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022年12月 C/C++(五级)真题解析#中国电子学会#全国青少年软件编程等级考试

第1题:漫漫回国路 2020年5月,国际航班机票难求。一位在美国华盛顿的中国留学生,因为一些原因必须在本周内回到北京。现在已知各个机场之间的航班情况,求问他回不回得来(不考虑转机次数和机票价格)。 时间限…

《论文阅读18》JoKDNet

一、论文 研究领域:用于大尺度室外TLS点云配准的联合关键点检测和特征表达网络论文:JoKDNet: A joint keypoint detection and description network for large-scale outdoor TLS point clouds registration International Journal of Applied Earth Ob…

(三)行为模式:7、观察者模式(Observer Pattern)(C++示例)

目录 1、观察者模式(Observer Pattern)含义 2、观察者模式的UML图学习 3、观察者模式的应用场景 4、观察者模式的优缺点 (1)优点: (2)缺点 5、C实现观察者模式的实例 1、观察者模式&…

应用案例 | 基于三维机器视觉的机器人麻袋拆垛应用解决方案

​Part.1 项目背景 在现代物流和制造行业中,麻袋的拆垛操作是一个重要且频繁的任务。传统的麻袋拆垛工作通常由人工完成,分拣效率较低,人力成本较高,现场麻袋堆叠、变形严重,垛型不规则、不固定,严重影响分…

无涯教程-Android - Activity

Activity代表具有用户界面的单个屏幕,就像Java的窗口或框架一样。Android Activity 是ContextThemeWrapper类的子类。 如果您使用过C,C或Java编程语言,那么您一定已经看到您的程序从 main()函数开始。与之非常相似,Android系统以 …

MyBatisPlus之DQL编程控制

🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaEE 操作系统 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 MyBatisPlus之DQL编程控制 一、 条件查询方式&…

【DB】Windows 环境修改MySql 8.0.x 密码

目录 一. 问题 二. 说明 三. 步骤 3.1 账户 3.2 服务 3.3 文件 四. 参考 一. 问题 好久没装数据了, 最近导入数据, 次哦,密码忘记了,网上搜了搜也不靠谱; 去管网上扒拉看看如何修改吧? 二. 说明 使用超级管理员模式, 看下本机 MySQL 版本号 $…

systemverilog之program与module的区别

为避免仿真和设计竞争问题(race condition),systemverilog中引入了program的概念。 在Verilog中,调度如下图所示: 从图中可以看出,阻塞赋值与非阻塞赋值的调度是不一样的,其中#0的阻塞延时赋值则处在中间的调度区域。…

计算机毕设之基于数据可视化的智慧社区内网平台python+django+mysql(含开题+源码+部署教程)

系统阐述的是一款基于数据可视化的智慧社区内网平台的设计与实现,对于Python、B/S结构、MySql进行了较为深入的学习与应用。主要针对系统的设计,描述,实现和分析与测试方面来表明开发的过程。开发中使用了 django框架和MySql数据库技术搭建系…

m4s格式转换mp4

先安装 ffmpeg,具体从官网可以查到,https://ffmpeg.org,按流程走。 转换代码如下,可以任意选择格式导出 import subprocess import osdef merge_audio_video(input_audio_path, input_video_path, output_mp4_path):# 构建 FFmpe…

使用postman做接口测试

1.接口测试:针对软件对外提供服务的接口的输入输出进行测试,以及接口间相互逻辑的测试,验证接口功能与接口描述文档的一致性 2.接口测试流程: 1)获取接口信息:通过接口文档或抓包来获取接口的基本调用方式和…

idea 常用插件和常用快捷键 - 记录

idea 常用插件 记得下载插件完成后,点击 Apply 和 OK Alibaba Java Coding Guidelines 作用:使用该插件可以,自动提示相关的语法格式问题,格式参考 阿里巴巴代码规范 详情链接: 代码规范之Alibaba Java Coding G…