BERT的继任者ModernBERT:融合长序列处理、代码理解与高效计算的新一代双向编码器

news/2024/12/24 10:49:18/文章来源:https://www.cnblogs.com/deephub/p/18626887

BERT 发布于 2018 年(从人工智能发展速度来看已是遥远的过去),但它至今仍在广泛使用:实际上它目前是 HuggingFace hub 上下载量第二高的模型,月下载量超过 6800 万次,仅次于另一个针对检索任务优化的编码器模型。这源于其编码器架构在处理日常实际问题方面表现出色,例如检索(如用于 RAG)、分类(如内容审核)和实体提取(如隐私保护和合规性检查)等任务。

经过六年的发展,我们终于迎来了它的继任者。ModernBERT 是一个全新的模型系列,在速度和准确性两个维度上全面超越了 BERT 及其后继模型。这个新模型整合了近年来大语言模型(LLMs)研究中的数十项技术进展,并将这些创新应用到 BERT 风格的模型中,包括对架构和训练过程的全面优化。

我们预计 ModernBERT 将成为目前广泛应用编码器模型领域的新标准,特别是在检索增强生成(RAG)管道和推荐系统等应用场景中。

ModernBERT 不仅在性能和速度上有所提升,还将上下文长度扩展到了 8k tokens(相比之下,大多数编码器仅为 512),并且首次在训练数据中大规模引入了代码数据。这些特性开启了此前开源模型无法实现的新应用领域,如大规模代码搜索、创新的 IDE 功能,以及基于完整文档而非小片段的新型检索管道。

在详细介绍这个新的架构之前,我们首先回顾一下这个领域的发展历程。

 

https://avoid.overfit.cn/post/3b7337af12a14732b3d24852ebe0a682

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/858025.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenHarmony怎么修改DPI密度值?触觉智能RK3566鸿蒙开发板演示

开源鸿蒙OpenHarmony系统下,修改DPI密度值的方法,触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566四核处理器,Laval鸿蒙社区推荐开发板,已适配全新开源鸿蒙OpenHarmony5.0 Release系统,适合鸿蒙开发入门学习本文介绍在开源鸿蒙OpenHarmony系统下,修改DPI密度值的…

医疗行业的项目管理革新:提升工作效率与患者体验

一、医疗行业的痛点 医疗行业在日常运营中面临一系列管理和运营上的挑战,以下是一些主要痛点: 1.任务管理与进度跟踪困难 在医院或医疗机构中,医疗任务和工作往往涉及多个科室、医护人员和患者。传统的管理方式通常依赖纸质记录或简单的电子表格,这种方法在任务繁多、协作复…

实战案例:基于 Java Web 技术的医药信息管理系统设计与构建

1. 引言 1.1系统目标 本医药信息管理系统旨在实现药品信息、进货信息、销售信息、库存信息、处方信息以及员工信息等的全面管理,提高医药企业运营效率,优化业务流程,确保信息准确、及时、安全,为企业决策提供有力支持,同时提升服务质量,增强企业竞争力。 1.2适用范围 本系…

CentOS安装GitLab社区版

官方文档给出的下载链接,貌似下不动。 因此选择使用清华大学的镜像站来下载社区版的GitLab https://mirror.tuna.tsinghua.edu.cn/help/gitlab-ce/ 于/etc/gitlab/gitlab.rb配置文件处,修改你的GitLab访问地址 默认GitLab访问地址是:external_url http://gitlab.example.c…

微信小程序云开发 校园二手交易平台

1.组员分工 在这个校园二手交易平台小程序中,我们组有着非常明细的分工。组内一共有四人,分别是祝辰、林炜辰、秦盼盼、吕冠逾,接下来我会一一描述分工。 祝辰:第七组的组长,主要整个软件项目工程的进度协调。在软件项目初期,主要负责用户图、类图、书序图的绘制,明确项…

冬季双旦节,宠物行业市场部用啥办公软件最佳?

随着冬季双旦节的临近,宠物行业迎来了业务的高峰期。在这个关键时期,仓储物流环节的高效运作对于满足宠物用品市场需求、提升客户满意度以及实现企业业绩增长起着举足轻重的作用。合适的可视化团队协作办公软件能够助力宠物公司更好地管理仓储物流,精准调配资源。本文将为宠…

小迪安全-基础入门-APP应用微信小程序原生态开发H5+Vue技术WEB封装打包反编译抓包点

APP应用&微信小程序&原生态开发&H5+Vue技术&WEB封装打包&反编译抓包点知识点: 1、基础入门-APP应用-开发架构安全问题 2、基础入门-小程序应用-开发架构安全问题 通用: 1、反编译-得到源码-源码提取资产(泄漏的配置信息)-安全测试 2、抓包-资产-安全测…

SARscape自动形变建模工具的使用

SARscape形变建模工具可利用InSAR形变数据或者大地测量数据和GPS作为数据源进行反演建模,可反演求出滑动/裂缝分布;利用构造源计算矩张量,得到形变机制图。可对构造变化(如地震等)、火山源和核爆炸等直接反演建模。 SARscape6.1推出自动建模工具,它能够自主执行非线性和线…

PostgreSQL 的特点

title: PostgreSQL 的特点 date: 2024/12/24 updated: 2024/12/24 author: cmdragon excerpt: PostgreSQL 是当今最流行的开源关系型数据库之一,凭借其优秀的性能、稳定性和丰富的功能集在用户群中享有极高声誉。相比于其他关系型数据库管理系统,PostgreSQL 拥有许多独特的特…

高效物流管理:项目管理工具如何助力快速响应

一、物流行业的痛点 物流行业的管理面临着复杂的任务、庞大的数据量和高度动态的工作环境,以下是一些主要的痛点: 1.任务与进度难以实时跟踪 在物流企业中,任务通常涉及多个环节,包括货物调度、仓储管理、配送规划、运输监控等。这些任务往往由不同部门或团队共同完成,任务…

2024.12.23 周一

2024.12.23 周一Q1. 1100 Alice and Bob are playing a game. They have an array $a_1, a_2,\ldots,a_n$. The game consists of two steps:First, Alice will remove at most $k$ elements from the array. Second, Bob will multiply at most $x$ elements of the array by …

yum源一键安装脚本

一、本地yum源镜像挂载到本地mkdir /mnt/cdrom mount /dev/sr0 /mnt/cdrom/ [root@test yum.repos.d]# df -h ...... /dev/sr0 4.4G 4.4G 0 100% /mnt/centos7将原有源进行备份(处理方式自行决定)cd /etc/yum.repos.d && mkdir bak && …