书生浦语大模型实战营第一课笔记

书生浦语大模型全链路开源体系

  • 课程笔记
    • 大模型的发展趋势
    • InternLM2的主要亮点
    • 模型到应用的典型流程
    • 全链路的开源工具
  • InternLM2技术报告笔记
    • 大型语言模型的发展
    • InternEvo
    • Model Structure
    • 训练数据

课程笔记

第一节课主要对大模型进行介绍,特别是书生浦语大模型的发展历史和目前的全链路开源体系进行总体介绍。

大模型的发展趋势

由专用模型向通用大模型发展。
通用大模型:一个模型应对多种任务,多种模态。一个模型可以应对文本,语音,图像等相关任务。

InternLM2的主要亮点

超长上下文综合性能全面提升优秀的对话和创作体验工具调用能力整体升级突出的数理能力和实用的数据分析功能
上传表格,可以根据用户的要求,进行数据的分析和画图展示,以及采用机器学习模型进行建模。

模型到应用的典型流程

在这里插入图片描述
实际从模型到应用中间还间隔比较多步骤,个别步骤还是比较复杂和有难度,为此,书生浦语提供了全链路的开源体系,降低这个过程的难度。

全链路的开源工具

在这里插入图片描述

InternLM2技术报告笔记

大型语言模型的发展

预训练、监督微调(SFT)和基于人类反馈的强化学习(RLHF)等阶段

InternEvo

高效的轻量级预训练框架,在减少通信开销,通信预计算的重叠,长序列训练,容错性等方面做了很多功夫进行优化。

Model Structure

在Transformer架构基础上进行了改进,从而提高了训练效率和性能。

训练数据

据来源分为网页、论文、专利和书籍,并以JSON Lines (jsonl)格式存储。
低质量的数据被排除,尽管它们的比例相对较小,但我们的实证研究发现,移除它们对于优化 模型性能和保证训练稳定性至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/573497.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

InfoNCE loss

InfoNCE loss是一种用于自监督学习的损失函数,通常用于训练对比学习模型,如自编码器或神经网络。全称是"InfoNCE: Contrastive Estimation of Neural Entropy",基于对比学习的思想,旨在最大化正样本的相似性&#xff0c…

【python可视化】折线图精粹:重点突出的艺术与技巧

为方便不同读者阅读,这里把python的代码解释也一起补充上来,完整的notebook欢迎关注微信公众号 数据分析螺丝钉 回复关键词 python可视化领取,重点是可视化的思路,用excel或者其他工具也能实现 步骤:需要先经过一轮分析…

开源项目ChatGPT-Next-Web的容器化部署(二)-- jenkins CI构建并推送镜像

一、背景 接着上文已制作好了Dockerfile,接下来就是docker build/tag/push等一系列操作了。 不过在这之前,你还必须在jenkins等CI工具中,拉取源码,然后build构建应用。 因为本文的重点不是讲述jenkins ci工具,所以只…

MySQL数据库基础--约束

约束 约束是作用于表中字段上的规则,用于限制在表中的数据 目的:保证数据库中数据的正确,有效性和完成性。 分类: 注意:约束是作用于表中字段上的,可以在创建表/修改表的时候哦添加约束 外键约束 外键用…

2024年3月28日蚂蚁新村今日答案:人间能得几回闻和冰蚕吐凤雾绡空哪句诗描写的云锦之美?

蚂蚁新村是一个虚拟社区。在这个虚拟社区中,用户可以参与各种活动,比如生产能量豆、做慈善捐赠等。同时,蚂蚁新村也提供了一些知识问答环节,用户在参与的过程中可以增进知识。这些问答内容往往涉及广泛的主题,如文化、…

如何借用 NTFS 交换数据流 实现隐藏文件?如何使用【文件包含】PHP伪协议?不同操作系统如何实现文件隐藏和木马伪装?

如何借用 NTFS 交换数据流 实现隐藏文件?如何使用【文件包含】PHP伪协议?不同操作系统如何实现文件隐藏和木马伪装? NTFS交换数据流(Alternate Data Streams, ADS)是NTFS文件系统特有的一种功能,它允许在同一个文件名下存储多个数据流。除了默认的数据流(通常用于存储文…

PCB中的走线布线技巧

PCB中的布线技巧 电磁兼容性(EMC)及关联的电磁干扰(EMI)历来都需要系统设计工程师擦亮眼睛,在当今电路板设计和元器件封装不断缩小、OEM要求更高速系统的情况下,这两大问题尤其令PCB布局和设计工程师头痛。另一方面,EMI是由EMC或不想要的电磁…

大会邀请 |北京智慧城市时空信息大会

2024年3月27-28日,2024中关村论坛系列活动一一首届智慧城市时空信息大会将在北京国际财富中心举办,大势智慧作为协办单位出席大会,重点展出公司自主研发的实景三维全自主、全流程系列软硬件产品,并为您带来公司在智慧城市、智慧应…

《手把手教你》系列技巧篇(五十七)-java+ selenium自动化测试-下载文件-下篇(详细教程)

1.简介 前边几篇文章讲解完如何上传文件,既然有上传,那么就可能会有下载文件。因此宏哥就接着讲解和分享一下:自动化测试下载文件。可能有的小伙伴或者童鞋们会觉得这不是很简单吗,还用你介绍和讲解啊,不说就是访问到…

Unity -- 遮挡剔除

很多童鞋的Unity作品完成后,发现场景卡的要死,尽管在模型阶段采用了很多优化建模方法,但还是卡顿。电脑端都这么卡,发布到移动端就更不用说了。遇到这种情况,很多童鞋急得团团转,不知如何是好。此时&#x…

格式化危机!教你轻松恢复数据!

一、遭遇格式化,数据恢复并非难事 当存储设备遭遇格式化后,许多人可能会陷入恐慌,担心重要数据一去不复返。但实际上,数据恢复并非如想象中那般困难。格式化操作主要清除了文件系统的索引信息,而实际的数据往往还残留…

来了!小学生Python创意编程(视频教学版)

目录 写在前面 推荐图书 推荐理由 写在最后 写在前面 在最好的年纪,一起来学Python吧!本期博主给大家推荐一本适合小学生阅读的书籍,一起来看看吧~ 推荐图书 小学生Python创意编程(视频教学版) 直达链接&#x…