一份来自政治学研究者的大模型“实用指南”

大模型,对一个社会科学的研究者意味着什么?

如果抛开一些为了追新打快蹭热点而进行的类似大模型+万物的“交叉科学”与“跨界研究”,只是将大模型视为一个“强大的工具”,那么这种“智能工具”如何赋能社会科学研究呢?

图片

最近,一些政治学领域的研究学者们从文本分析中的“数据标注”为切入点,为众多社会科学研究者提供了一份在文本分析研究中使用大模型的“实用指南”,论文作者发现,在文本分析的数据标注中使用大模型,不仅可以做到与人类标注者标注质量相当,而且还可以将标注成本降低 60%,标注时间降低近百倍。

论文题目:
How to Use Large Language Models for Text Coding: The Case of Fatherhood Roles in Public Policy

论文链接:
https://arxiv.org/pdf/2311.11844.pdf

早在深度学习的浪潮之初,许多社会科学研究者们就已经开始寻求使用譬如自然语言处理的技术扩展自己研究的范围以及降低自己的研究成本。计算机与相应文本分析、统计模型的引入可以使得研究者广泛无偏的挖掘与分析蕴藏在大量非结构化信息中的“社会议题”

举个例子,如果一个政治学研究者需要分析在公共政治话语中“父亲”这一语词的角色变化,以服务自己构建的政治分析理论,那么在使用相应这种计算机技术之前,从大量公共政策文件中抽丝剥茧对包含父亲的语词进行提取判断事实上是一种重复的体力劳动,并且受限于人力成本以及不可避免的分析者的个人判断选择,结论总是将会带有主观性与偶然性

图片

在引入计算机技术之后,无疑借助计算机的信息处理能力使得政治学研究者们可以极大的扩展自己的研究边界与研究范围,以更广泛的数据支持自己的研究结论。但是,在进行文本分析尤其是文本编码任务之时,在垂直领域缺乏高质量的专用数据以及高昂的标注成本又成为了研究者们的拦路虎。

而大模型的出现,恰恰就可以在“数据标注”这一小任务中极大的解放研究者们的双手,甚至从这一步骤出发,大模型未来可能将会带来研究们进行文本分析的潜在规划、成本效率等等方面的巨大改变。那么到底如何才能高效的将大模型嵌入到社会科学学者们进行文本分析的工作流之中呢?这篇论文便以作者自己的一个研究课题“瑞典政治话语中的‘父亲角色’研究”来展示大模型如何赋能政治学研究。

图片

首先,让我们先来介绍一些研究背景,这篇论文的作者们主要针对从 1993年到 2021 年间瑞典政府的政策文件,包含政府提案、报告、立法、调研文件等等,研究公共政治话语中传统的父亲角色如何转变为所谓的“New Father”

面对大量语料,作者首先将原始文本中含有“父亲(瑞典语中pappa、pappor、fader、fader、far)”的文本提取出来,通过使用词性标注器完成过滤后获得 1911 个句子,在得到初步的文本后,遵循这样一个研究步骤对问题进行分析:

  1. 根据理论分析,确定研究对象在文本中的类别种类;

  2. 手动构建一个包含数百示例的分类验证集以评估模型效果;

  3. 构建初始的 Prompt;

  4. 进行 Prompt 工程对提示进行微调;

  5. 依据最佳 Prompt 效果完成数据标注。

对应到父亲角色分析之中,作者从三个研究方面确定了父亲角色的分类标签,分别是:

  1. 父亲在家庭中的角色

    • 消极正向(PASSIVE):不参与家庭生活,不与孩子接触,仅仅作为家庭经济来源的提供者或家庭的保护者;

    • 积极负向(ACTIVE NEGATIVE):家庭生活中具有严厉、压迫、暴力、具有攻击性、体罚等的危险特征;

    • 关怀正向(ACTIVE POS CARING):家庭生活中具有关怀、温暖、培育、理解、同理心、倾听、安慰等温柔特征;

    • 冒险正向(ACTIVE POSITIVE DARING):家庭生活中具有冒险、大胆、挑战、运动、外向等积极特征;

    • 其他积极(ACTIVE POSITIVE OTHER):家庭生活中具有正向引领作用,譬如可靠、责任、信任等等能力但又部署于上述其他标签的角色;

    • 不适用(NOT APPLICABLE):文本中体现不出父亲的角色信息。

  2. 描述的明确性

    • 显式(EXPLICIT):正面介绍了父亲的角色;

    • 隐式(IMPLICIT):对父亲角色的描述包含在暗示之中。

  3. 描述的规范性

    • 事实(DESCRIPTIVE):描述性的介绍父亲角色的事实;

    • 理想(IDEAL):介绍父亲角色的理想状态。

基于确定好的分类标注,作者手动构建了 350 个句子分类作为模型的验证集,使用 OpenAI 的 GPT-3 与 GPT-4 模型进行实验。在构建 Prompt 的部分,作者使用英语(文本是瑞典语)书写指令,从语料库中,作者选择了 15 个例句,对模型进行 few-shot learning,并且组合三种任务下不同的标签与示例尝试了不同的 Prompt,针对上述三个任务,作者使用的 Instruction 分别为

  1. 父亲在家庭中的角色

图片

  1. 描述的明确性

图片

  1. 描述的规范性

图片

从数据标注质量、速度与成本三个方面,作者对大模型应用于文本分析中的数据标注进行了评价,在质量上,作者发现大模型首先通过调整 temperature 参数获得比人类标注更加具有“一致性”的回答,而对于这个有时经过训练的人类标注者也会出错的任务而言,大模型,尤其是 GPT-4 获得了最佳的效果,全面优于 GPT-3 以及单个的人类标注者

图片

而从速度上来看,大模型“标注” 1911 个句子的时间约为 16 分钟,而人类标注者每小时只能标注约 100 条句子,速度高过人类标注者百倍。从成本而言,调用 OpenAI 模型的成本是 94 美元,而人类标注者每小时工资为 12.35 美元,工作 19 个小时成本为 234.65 美元,是模型成本的 2.5 倍。当然,效果之外,作者也表示了对大模型的机器幻觉问题的担忧,当不可控的模型给出“不道德”的标注并以此用于政治学分析中,将有可能导致许多额外的问题。

图片

最后的最后,作者讲到这篇别致的论文只是他们针对公共政治话语中“父亲”这一语词的角色变化研究的前置工作,更加理论性的分析将在后面的问题中进行,只是将这种“新方法”作为指南进行分享,期望开启在社会科学研究中从“亲自动手”到“LLM来做”的转变

尽管这篇论文提供的还仅仅是一个大模型最基础不过的应用,但是作为一个开始,我想大模型未来不仅仅将会变革计算机、生物、材料等等理工科学,也一定会成为政治、社会、心理等诸多人文社会科学研究者的最重要的工具与助手吧

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/286360.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

轻空间气膜体育馆打造绿色运动空间

近年来,我国为全面实施全民健身战略,坚持“发展群众体育,服务健康中国”的理念,积极推动群众参与各类体育活动。为了满足全民健身和全面小康的深度融合发展需求,我国正在不断拓展公共体育设施的建设与开放。气膜体育馆…

光储充综合新能源储能系统研究笔记

1. 微电网与储能 1.1. 储能 1.1.1. 概述 储能是指电力储能,属于一种电网供需平衡技术。电力储能的形式通常是通过将电能转化为动能、(水)势能、化学能等形式进行储存,在需要时再转化回电能。尽管电力储能技术并非新兴技术,但从产业角度来看…

服务器解析漏洞是什么?攻击检测及修复

服务器解析漏洞(Server-side Include Vulnerability,SSI漏洞)是一种安全漏洞,通常出现在支持服务器端包含(SSI)功能的Web服务器上。SSI是一种在Web页面中嵌入动态内容的技术,允许开发人员将外部…

Amazon CodeWhisperer 体验

文章作者:jiangbei 1. CodeWhisperer 安装 1.1 先安装 IDEA,如下图,IDEA2022 安装为例: 亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者…

漏洞复现-TurboMail viewfile 文件读取漏洞(附漏洞检测脚本)

免责声明 文章中涉及的漏洞均已修复,敏感信息均已做打码处理,文章仅做经验分享用途,切勿当真,未授权的攻击属于非法行为!文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直接或者间接的…

目标检测——YOLO算法解读(通俗易懂版)

论文:You Only Look Once: Unified, Real-Time Object Detection 作者:Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi 链接:https://arxiv.org/abs/1506.02640 代码:http://pjreddie.com/yolo/ yolo系列检测算法开…

C#经常用的加密解密算法

1. 引言 在软件开发中,数据的安全性和保密性非常重要。为了保护数据免受未经授权的访问和泄露,我们经常需要对敏感数据进行加密和解密。在C#中,有许多常用的加密解密方法可供选择。本文将详细介绍C#中经常使用的加密和解密方法。 目录 1. 引…

QT设置鼠标样式 QWidget::setCusor()

1、使用Qt内置鼠标样式 例如手型: button->setCursor(Qt::PointingHandCursor); 其他类型: 2.自定义鼠标样式3种方式: 2.1.使用函数生成鼠标样式的图片 2.2使用画图工具生成鼠标样式的图片 2.3使用XPM生成鼠标样式 这三种方式参考&…

「吞噬星空」黑龙飞船售128亿,罗峰晋级恒星买地球,大危机降至

Hello,小伙伴们,我是拾荒君。 《吞噬星空》的国漫第98集已经更新,如同众多的粉丝一样,拾荒君也迫不及待地观看了这一集。在这一集中,布罗临死前向诺岚山家族透露了地球的坐标,这一举动无疑将地球暴露在了危险之中。现…

[笔记] linux 4.19 版本 Kbuild 编译流程解析

目录 写在前面与一些说明linux 编译工程框架 KbuildTop-Makefile 文件 linux 编译命令make helpdistclean 目标defconfig 目标build 变量与 $(build)dir 赋值使用 obj 变量实现包含目标模块下的 makefiledefconfig 规则展开defconfig 的生成命令解析 make 默认目标生成 image.g…

万户OA text2Html接口存在任意文件读取漏洞

文章目录 产品简介漏洞概述指纹识别漏洞利用修复建议 产品简介 ezoffice是万户网络协同办公产品多年来一直将主要精力致力于中高端市场的一款OA协同办公软件产品,统一的基础管理平台,实现用户数据统一管理、权限统一分配、身份统一认证。统一规划门户网…

喜报!巨蟹数科荣获国家“高新技术企业”认定!

根据《高新技术企业认定管理办法》(国科发火〔2016〕32 号)和《高新技术企业认定管理工作指引》(国科发火〔 2016〕195号)有关规定,经省高新技术企业认定管理机构组织企业申请、专家评审等程序,并经全国高新…