CS Course Learning

news/2025/2/24 14:28:48/文章来源:https://www.cnblogs.com/scy157609962/p/18728759

【李宏毅】2024大语言模型课程

课程学习

课程链接：https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php

Bilibili相关视频链接：https://www.bilibili.com/video/BV1XS411w7qr

GPT: Autoregressive model

In-context Learning

Chain of Thoughts (CoT)
Tree of Thoughts (ToT)
Algorithm of Thoughts (AoT)
....

使用工具：

搜寻引擎 Retrieval Augmented Generation (RAG)
写程序 Program of Thought (PoT)
文字生图 DALL-E

Explainable ML:

Local Explanation
- Saliency Map
- SmoothGrad (improved Saliency Map)
- Integrated Gradient(IG)
Global Explanation

Three steps of LLM training:

Pre-train -> Foundation model
Instruction Fine-tuning (Supervised Learning)
Reinforcement Learning from Human Feedback (RLHF)

Seq2seq:

Syntactic Parsing (文法分析)
Multi-label Classification (区别于 Multi-class Classification)

An object can belong to multiple classes
Object Detection

Tranformer:

Self-attention
Cross-attention

Copy Mechanism => Summarization

Pointer Network

Attention Decoder

Greedy Decoding (每次都选择输出概率最大的token)
Bean Search
Sampling (more creative, randomness is needed for decoder when generating)

作业总结

【李宏毅】2023机器学习系列课程

课程链接：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php

课程学习

能够使用工具的AI：

WebGPT
Toolformer

作业总结

trainer

# trainer
n_epochs = config['n_epochs']
criterion = nn.MSELoss(reduction='mean')  # define loss function
optimizer = torch.optim.SGD(model.parameters(), lr=config['learning_rate'], momentum=0.7)  # define optimizerfor epoch in range(n_epochs):# trainmodel.train()loss_record = []for X, y in train_loader:optimizer.zero_grad()X, y = X.to(device), y.to(device)pred = model(X)loss = criterion(pred, y)loss.backward()optimizer.step()loss_record.append(loss.detach().item())  # loss value of a batch : loss.detach().item()mean_train_loss = sum(loss_record) / len(loss_record)# evaluatemodel.eval()loss_record = []with torch.no_grad():for X, y in valid_loader:X, y = X.to(device), y.to(device)pred = model(X)loss = criterion(pred, y)loss_record.append(loss.detach().item())  # loss value of a batch : loss.detach().item()mean_eval_loss = sum(loss_record) / len(loss_record)

tensorboard

.from torch.utils.tensorboard import SummaryWriterwriter = SummaryWriter() # Writer of tensoboard.
writer.add_scalar('Loss/train', mean_train_loss, step)
"""
def add_scalar(tag: Any,  # 图表的名称scalar_value: Any,  # 纵坐标取值global_step: Any | None = None,  # 横坐标取值walltime: Any | None = None,new_style: bool = False,double_precision: bool = False
)
"""

【ETH】2020 Digital Design and Computer Architecture

课程链接：https://safari.ethz.ch/digitaltechnik/spring2020/doku.php?id=start

课程视频链接：https://www.youtube.com/playlist?list=PL5Q2soXY2Zi_FRrloMa2fUYWPGiZUBQo2

课程学习

作业总结

【UCB】2020 Structure and Interpretation of Computer Programs

课程链接：https://web.archive.org/web/20210104105406/https://cs61a.org/

课程视频链接：https://www.bilibili.com/video/BV1s3411G7yM/

课程学习

作业总结

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/889014.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

跟着狂神学markdown作业01天

markdown学习标题一共可以做六级标题格式为#+空格+标题几级标题就打几个空格字体粗体：hello，world 两边各加两个*号斜体：hello，world 两边各加一个*号粗体+斜体：hello，world 两边各加三个***号删除效果：hello，world 引用选择狂神说java，走向人生巅峰（用>…

java知识面试day4

1.常见的关键字有哪些static:静态变量，静态变量被所有对象共享，在内存中只有一个副本。具有静态变量，静态方法块，静态代码块(在类加载时候被指执行一次),静态内部类:非静态内部类需要依赖外部实列，但静态内部类不需要。final 基本数据类型用final修饰不能修改，引用对象被…

[QOJ 8366] 火车旅行

毒瘤边化点，有人说非排列只需要加一些细节，但是这个题毒瘤在于非排列。 statement 给定一个长度为 \(n\) 的序列 \(a_i\)。对于位置 \(x\) 和 \(y\)：若 \(y < x\) 且 \(max_{y < i < x} a_i < min(a_x, a_y)\) 则位于 \(x\) 的棋子可以花费 \(L_x\) 的代价跳到…

uipath更新到最新版本2025.0.161出现严重问题

uipath更新到最新版本2025.0.161出现严重问题：1. 打开既有项目，会报CS0246错误2. 无法创建新项目，一直报无权限访问尝试办法：1. 重新安装uipath，未解决2. 删除项目重新添加，未解决3. 给账户添加最高权限，未解决 workaround：把项目从默认文件夹复制到其他盘（除了C盘外…

Python正则表达式之re.compile函数

在Python编程语言中，re.compile函数是正则表达式模块(re)中的一个核心组件，它负责将文本形式的正则表达式编译成一个正则表达式对象。这个对象随后可以被用来执行高效的模式匹配操作，如查找、替换或者分割字符串等。理解并有效利用 re.compile对于编写高效且可维护的正则表…

Unity Addresable打包总结第二弹

前言前文介绍了Addressables在本地打包是怎么使用，这里介绍下怎么打远程包，并且怎么做到打增量包，Lets Go! 远程包新建一个Group，将它的 BUild & Load Paths 改为Remote，并将RemoteRes资源文件夹塞入Remote Group，其中包含一个Capsule.prefab资源：在Addressabvles …

BUUCTF-RE-[2019红帽杯]easyRE

这道题很难，但是并不难在他的解题要用到的方法和技巧上，而是难在它的题目设计。做的过程中真的有一种闯关的感觉，非常有趣首先我们通过对字符的定位我们可以来到sub_4009C6函数 __int64 sub_4009C6() {__int64 result; // raxint i; // [rsp+Ch] [rbp-114h]__int64 v2; // …

2025年免费项目管理软件哪家强？5款零成本工具实测报告

在项目管理领域，众多团队尤其是初创企业和小型项目组，都渴望找到功能实用且零成本的软件来助力项目推进。2025 年，有 5 款免费项目管理软件表现突出，它们分别是禅道、Trello、Asana、Redmine 以及国内新兴的钉钉项目管理相关功能，下面将为大家带来详细的实测报告。一、禅道…

BT151-ASEMI电机控制专用BT151

BT151-ASEMI电机控制专用BT151编辑：ll 在当今科技飞速发展的时代，电子元件宛如繁星般点缀着各个领域，而 BT151 单向可控硅无疑是其中一颗极为耀眼的明星。 BT151-ASEMI电机控制专用BT151 型号：BT151 品牌：ASEMI 封装：TO-220F 正向电流：12A 反向电压：600V~800V 引脚数量…