使用Hugging Face预训练Bert处理下游任务显存占用过多-编程知识

使用Hugging Face预训练Bert处理下游任务显存占用过多

news/2025/3/9 22:29:31/文章来源:https://blog.csdn.net/weixin_46052886/article/details/131732260

在使用HuggingFace的transformer下的BertForMaskedLM进行预训练语言模型的load时，bert会占用很大的显存。
这里可以考虑使用TinyBERT，速度和显存上都能得到很大的优化。
在这里插入图片描述
具体的方法进入https://huggingface.co/huawei-noah/TinyBERT_General_4L_312D/tree/main链接中，download其中的model参数，以及词典表、config。
在load模型时load这些文件就可以了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/22946.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

前端（五）——从 Vue.js 到 UniApp：开启一次全新的跨平台开发之旅

前端（五）——从 Vue.js 到 UniApp：开启一次全新的跨平台开发之旅

🙂博主：小猫娃来啦 🙂文章核心：从 Vue.js 到 UniApp：开启一次全新的跨平台开发之旅文章目录 UniApp和vue.js什么是UniApp？UniApp的写法什么是vue.js？UniApp与vue.js是什么关系？ 为什…

阅读更多...

选择排序算法介绍

选择排序算法介绍

算法介绍选择排序（Selection Sort）是一种简单直观的排序算法。它的基本思想是每次从待排序的元素中选取最小（或最大）的元素，放到已排序部分的末尾，直到全部元素排序完毕。以下是选择排序的详细步骤&…

阅读更多...

10.5.2 【Linux】命令执行的判断依据, ，||

10.5.2 【Linux】命令执行的判断依据, ，||

cmd ; cmd （不考虑指令相关性的连续指令下达） 在某些时候，我们希望可以一次执行多个指令，例如在关机的时候我希望可以先执行两次sync 同步化写入磁盘后才 shutdown 计算机，那么可以这样作： [rootstudy ~]…

阅读更多...

实现一个vscode插件：打开多个vscode项目时根据.nvmrc文件自动切换nvm

实现一个vscode插件：打开多个vscode项目时根据.nvmrc文件自动切换nvm

开发背景与最终功能需要维护一些老项目，同时开发新项目时，切换nvm很烦人最终实现vscode插件：每个vscode实例打开一个项目，切换vscode实例时能自动切换版本（需要项目根目录有一个.nvmrc文件） 插件下载 …

阅读更多...

数学建模———层次分析法及其matlab语法，函数和代码实现

数学建模———层次分析法及其matlab语法，函数和代码实现

层次分析法思想登场建模比赛中最基础的模型之一，其主要用于解决评价类问题（例如：选择那种方案最好，哪位运动员或者员工表现的更优秀。） 评价类问题字眼： 评价的目标是什么？达到这个目标有那…

阅读更多...

【已解决】JavaScript为控件绑定事件死活不生效

【已解决】JavaScript为控件绑定事件死活不生效

本博文源于最近操作的JavaScript一个诡异的事情。我在用js一个动态生成的按钮，然后想要为其绑定一个alert的事件，结果发现控制台给我报未定义的错误，我慌的不要要的，经过长时间胡乱尝试终于解决了。问题再现 dataHtml "&…

阅读更多...

uniapp 打包安卓apk (原生App)云打包

uniapp 打包安卓apk (原生App)云打包

uniapp 打包安卓apk (原生App)云打包 hbuilder中操作项目的一些配置appid DCloud appid 用途/作用/使用说明： https://ask.dcloud.net.cn/article/35907 右键我们项目目录-》发行-》原生APP-云打包说明： 1. 打包安卓，只选择安卓打包项&…

阅读更多...

【Redis】—— Redis的RDB持久化机制

【Redis】—— Redis的RDB持久化机制

💧 【 R e d i s 】—— R e d i s 的 R D B 持久化机制 \color{#FF1493}{【Redis】 —— Redis的RDB持久化机制} 【Redis】——Redis的RDB持久化机制💧 🌷 仰望天空，妳我亦是行人.✨ 🦄 个人主页——微风撞…

阅读更多...

Jupyter notebook添加与删除kernel

Jupyter notebook添加与删除kernel

目录 1 添加虚拟环境的kernel 2 删除jupyter notebook已有的kernal 3 切换内核与查看当前内核 4 添加C语言的kernel 5 添加python2的kernel 6 添加java语言的kernel 6.1 sudo apt install default-jre 6.2 下载并安装 ijava 6.3 sudo apt install openjdk-11…

阅读更多...

RabbitMQ ---- Hello World

RabbitMQ ---- Hello World

RabbitMQ ---- Hello World 1. 依赖2. 消息生产者3. 信息消费者本节使用 Java 编写两个程序。发送单个消息的生产者和接收消息并打印出来的消费者。 1. 依赖 <build><plugins><plugin><groupId>org.apache.maven.plu…

阅读更多...

前端开发中的微服务架构设计

前端开发中的微服务架构设计

前端服务化和小程序容器技术为前端应用带来了更好的组织结构、可维护性和可扩展性。这些技术的应用将促进前端开发的创新和发展，使团队能够更好地应对复杂的前端需求和业务挑战。通过将前端视为一个服务化的架构，我们能够构建出更强大、可靠且可持续的前…

阅读更多...

独立看门狗 IWDG

独立看门狗 IWDG

独立看门狗介绍 Q：什么是看门狗？ A：可以理解为对于一只修勾的定时投喂，如果不给它吃东西就会狂叫，因此可以通过观察修勾的状态来判断喂它的人有没有正常工作。在由单片机构成的微型计算机系统中，由于单…

阅读更多...

推荐文章

最新文章