LLMs 生成式人工智能项目生命周期备忘单Generative AI Project Lifecycle Cheat Sheet

到目前为止,在本课程中,从选择模型到微调模型,再到将其与人类偏好对齐,这一切都将在您部署应用程序之前发生。为了帮助您规划生成式AI项目生命周期的各个阶段,这个速查表提供了每个工作阶段所需的时间和精力的一些指示。正如您之前所见,预训练大型语言模型可能是一个巨大的工作。由于模型架构决策、所需的大量训练数据和所需的专业知识,这个阶段是您将面临的最复杂的阶段。
在这里插入图片描述

不过请记住,通常情况下,您将以现有的基础模型为基础开始开发工作。您可能能够跳过这个阶段。

如果您正在使用基础模型,您可能会通过提示工程来开始评估模型的性能,这需要较少的技术专业知识,也不需要对模型进行额外的训练。
在这里插入图片描述

如果您的模型没有达到您的需求,接下来您将考虑提示调整和微调。根据您的用例、性能目标和计算预算,您将尝试的方法可能从全面微调到参数高效微调技术,如laura或提示调整不等。这项工作需要一定程度的技术专业知识。但由于微调在相对较小的训练数据集上可能非常成功,因此这个阶段可能在一天内完成。
在这里插入图片描述

使用来自人类反馈的强化学习来对齐您的模型可以很快完成,一旦您有了训练的奖励模型。您可能会尝试看是否可以使用现有的奖励模型来进行这项工作,就像您在本周的实验中看到的那样。
在这里插入图片描述

然而,如果您必须从头开始训练奖励模型,由于收集人类反馈所需的工作量,可能需要很长时间。

最后,在上一个视频中学到的优化技术通常在复杂性和工作量方面处于中间位置,但假设对模型的更改不会太大地影响性能,可以迅速进行。
在这里插入图片描述

经过所有这些步骤后,您希望已经培训和微调了一个适用于您特定用例的优化部署的LLM。祝贺您!在本课程的最后一系列视频中,您将探讨LLM性能的其余问题,您可能需要在启动应用程序之前解决,以及可以克服这些问题的技术。让我们继续前进,看看接下来的内容。

Reference

https://www.coursera.org/learn/generative-ai-with-llms/lecture/VaOBV/generative-ai-project-lifecycle-cheat-sheet

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/128532.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于 “高可用集群” 的 从业经验漫谈

关于高可用集群 PART 1 高可用的概念 高可用(High Availability)是高可用集群(High Availability Cluster)的简称,至少由2台服务器组成,一般指的是应用服务对客户端的持续可用。高可用集群可以借助多种技术…

Javascript笔记:Web页面中的事件处理

1 任务队列 2事件处理:⼀个只有宏任务的示例 3 Web⻚⾯中的事件处理 3.1 定时器与事件处理:一个实例 4 Web⻚⾯中的事件处理 5 事件在DOM中的传播 5.1 两个阶段

数据结构 | (三) Stack

栈 :一种特殊的线性表,其 只允许在固定的一端进行插入和删除元素操作 。 进行数据插入和删除操作的一端称为栈顶,另一端称为栈底。栈中的数据元素遵守后进先出LIFO ( Last In First Out )的原则。 压栈:栈…

ES6 class类关键字super

super关键字 在 JavaSCript 中,能通过 extends 关键字去继承父类 super 关键字在子类中有以下用法: 当成函数调用 super() 作为 "属性查询" super.prop 和 super[expr] super() super 作为函数调用时,代表父类的构造函数。 ES6 要求…

stm32的时钟、中断的配置(针对寄存器),一些基础知识

一、学习参考资料 (1)正点原子的寄存器源码。 (2)STM32F103最小系统板开发指南-寄存器版本_V1.1(正点) (3)STM32F103最小系统板开发指南-库函数版本_V1.1(正点&#xff0…

基于可解释性特征矩阵与稀疏采样全局特征组合的人体行为识别

论文还未发表,不细说,欢迎讨论。 Title: A New Solution to Skeleton-Based Human Action Recognition via the combination usage of explainable feature extraction and sparse sampling global features. Abstract: With the development of deep …

查看当前目录下文件所占用内存 du -sh

1. du -sh 查看当前目录下文件所占用内存 2.查看当前文件夹下,每个文件所占用内存 du -ah --max-depth1/

《DevOps 精要:业务视角》- 读书笔记(二)

DevOps 精要:业务视角(二) 第2章 基础2.1 精益生产2.1.1 关键事实2.1.2 挑战 2.2 敏捷2.2.1 关键事实2.2.2 挑战 第2章 基础 2.1 精益生产 2.1.1 关键事实 正如1.2节提到的,DevOps非常依赖于精益生产的原则与实践。有些人甚至相信&#xf…

2023年中国智慧医院市场现状及行业发展趋势分析[图]

自2019年开始,国家卫健委首次提出了智慧医院这一概念ꎬ并明确提出包含的三个方面,即:一是智慧医疗方面,主要面向医院所有医务人员使用者,以深层次提升医院信息化建设为目标ꎬ规范参照…

如何实现 Es 全文检索、高亮文本略缩处理

如何实现 Es 全文检索、高亮文本略缩处理 前言技术选型JAVA 常用语法说明全文检索开发高亮开发Es Map 转对象使用核心代码 Trans 接口(支持父类属性的复杂映射)Trans 接口的不足真实项目落地效果 前言 最近手上在做 Es 全文检索的需求,类似于…

pycharm配置python3.8版本专门用于undecteded_chromedriver测试

pycharm配置python3.8版本专门用于undecteded_chromedriver测试 作者:虚坏叔叔 博客:https://pay.xuhss.com 早餐店不会开到晚上,想吃的人早就来了!😄 一、Pycharm及python环境的配置 1.安装python-3.8.7rc1-amd64.e…

c++视觉---使用轨迹条设置图片的对比度,亮度

轨迹条:cv::createTrackbar cv::createTrackbar 是OpenCV库中的一个函数,用于创建一个图形用户界面 (GUI) 中的滑动条控件,允许用户在应用程序运行时调整特定参数的值。这个函数的调用方式如下: int cv::createTrackbar(const s…