AI读心术:情感分析和数据标注的奥秘

情感分析也被称为情感分类,意图挖掘;是让机器去辨别和理解人类的情感语言文本的技术。互联网技术发展至今,人人都和手机形影不离,任何消费行为、生活休闲、美食评论、旅行决策都可以通过网络的连接让信息共享和公开。商家也利用这些被互联网记录下来的信息做着重要的商业决策和营销方案。比如舆情监控,比如用户反馈信息,任何正面或者负面的信息都左右着消费者的购买动向,也因此,商家会更希望以更快捷、更有效的方式获得这些信息以满足他们的用户需求。 能读懂人心的机器就像是X战警里Professor X的心灵感应和精神控制的能力,从人类内心深处窥探和掌握意图动向,用好的产品得到好评,收到负面评论去评判原因和归因以加强产品迭代和优化。而这一切的一切离不开数据对机器的教导,才能去让机器读懂人类的情感,去理解人类的意图。 本文将浅谈情感分析是什么,如何做情感分析的数据标注,如何获取情感分析的数据。

什么是情感分析?

情感分析能够通过提取特定的词或短语来判断一条内容是正面、负面还是中立的。情感分析的主要目的是分析受众对某些产品、事件、人物或言语的看法。相对于客观事实,情感是主观的表达方式,用来描述一个人对某个特定主题或话题的感受。虽然 “情感 “和 “情绪 “被许多人交替使用,但这两个概念之间存在着根本的区别。情感意味着对一个目标的更有组织的处置,而情绪描述的是一种非自愿的生理反应。 在文本中,情感可以用两种不同的方式来表达。它可以是显性的,就是直接表达意见(例如:”这条裙子真好看”),或者是隐性的,即文本暗示意见(例如:”我的裙子去年被撑坏了。”)。大多数情感分析研究的重点是显性情感,因为这类情感更容易被发现和分析。通常分析情感有两个方面:

  • 情感极性:分析情感的方向。(是正面还是负面?)
  • 情感强度:情感程度由高到低

如何做情感分析的数据标注?

通过基于人工智能的情感分析模型,使视频中的文本、音频或语音等语音数据能够被理解。NLP标注、实体标注和文本标注是常见的语音数据标注方式,通过这一类的数据标注能够训练机器读懂人类的情感,并在下次判断中分析不同人的情感。

启动情感分析标注项目的建议

  • 制定项目章程和标准

让基于文本的情感标注更为简单。很多情感分析项目中牵扯到大量的文本标注,简单直白的显性文本类似“咖啡好难喝”可以要求标注人员直接标注出“正面”、“负面”还是中立;复杂的隐性文本就会难以制定一个标准。因此,如果涉及一些“讽刺”、“反讽“等复杂情绪的表达时,标准就显得尤为重要,这直接影响了项目的周期和数据交付的质量。

  • 数据标注流程和质检规范:

为了帮助尽可能地减少人为错误,标注团队需要经过严格的培训和考核。特别是在情感分析的情况下,往往没有正确或错误的答案,因此很难衡量准确性。像Cohen’s kappa (κ), Fleiss’ kappa (K), 或Krippendorff’s alpha这样的指标来衡量标注人员之间的一致性,可以作为衡量质量的指标。这些指标可用于分析标记的数据集和标注标准,以改善标注过程碰到的一系列标注疑难。

如何获取情感分析的数据

对消费者洞察力日益增长的需求将使情感分析和意见挖掘在未来保持强烈的相关性。这种快速增长的技术有可能颠覆大量的行业,并改善客户体验。 澳鹏是情感分析和内容相关性标注领域的训练数据供应商。澳鹏数十年来深耕语言学领域,积累了丰富的专业经验。我们的全球众包资源遍布 170 +个国家/地区,支持 235+种语言的专业知识。我们已经助力众多零售/电子商务、金融、保险、医疗、交通等行业的企业成功落地了 NLP 项目。我们提供训练数据,帮助构建能够理解人类文本和语音并提取其中含义的智能系统,可应用于多种AI场景,例如聊天机器人、语音助手、搜索相关性、情绪分析等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/29102.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS/OpenHarmony应用开发-程序包多HAP机制(下)

三、多HAP的开发调试与发布部署流程 (一)多HAP的开发调试与发布部署流程如下图所示。 图1 多HAP的开发调试与发布部署流程 (二)开发 开发者通过DevEco Studio工具按照业务的需要创建多个Module,在相应的Module中完成…

[深度学习实战]基于PyTorch的深度学习实战(上)[变量、求导、损失函数、优化器]

目录 一、前言二、深度学习框架——PyTorch2.1 PyTorch介绍2.2 Python安装详解2.3 PyTorch安装详解 三、变量四、求导五、损失函数5.1 nn.L1Loss5.2 nn.SmoothL1Loss5.3 nn.MSELoss5.4 nn.BCELoss5.5 nn.CrossEntropyLoss5.6 nn.NLLLoss5.7 nn.NLLLoss2d 六、优化器Optim 6.1 …

爬虫+Flask+Echarts搭建《深度学习》书评显示大屏

爬虫FlaskEcharts搭建《深度学习》书评显示大屏 1、前言2、实现2.1 挑选想要采集的书籍2.2 构建爬虫2.2.1 采集书籍信息2.2.2 采集书评 2.3 数据清洗2.3.1 清洗书籍信息2.3.2 清洗书评信息 2.4 统计分析,结果持久化存储2.5 搭建flask框架2.6 数据传值2.7 完整代码&a…

Microsoft Outlook如何建立联系人组 ?

New Items→More Items→Contact Group 选择Add Members→From Address Book

深度学习(29)—— DETR

深度学习(29)—— DETR DETR代码欢迎光临Jane的GitHub:在这里等你 看完YOLO 之后,紧接着看了DETR。作为Transformer在物体检测上的开山之作,虽然他的性能或许不及其他的模型,但是想法是OK的。里面还有一些…

C国演义 [第十二章]

第十二章 打家劫舍题目理解步骤dp数组递推公式初始化遍历顺序 代码 打家劫舍II题目理解步骤递推公式初始化遍历顺序 代码 打家劫舍 力扣链接 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋…

周报(1)

文章预览: 本周内容:Python语言的学习和pytorch安装配置1 Python基础知识1.1 交互式解释器1.2 数和表达式1.3 变量1.4 获取用户输入1.5 函数1.6 模块1.7 字符串1.7.1 单引号字符串以及对引号转义1.7.2 拼接字符串1.7.3 字符串表示str 和repr Pytorch 的安…

Knife4j-的使用(详细教程)

文章目录 前言一、简介二、版本参考三、基本使用1. 导入相关依赖2. 比对效果3. 增强特性应用 四、Spring-Cloud 整合1. 项目准备2. 实现步骤2.1 依赖引入2.2 编写配置类2.2.1基础信息配置2.2.2 配置接口信息2.2.3 安全认证配置 2.3 常用注解的使用2.3.1 Api2.3.2 ApiOperation2…

【unity实战】手搓一个网格放置功能,及装修建造种植功能(2d3d通用,附源码)

文章目录 前言开始项目和素材1. 素材来源2. 开始项目包(两种选择一种下载导入即可) 开始1. 修改鼠标指针显示2. 给鼠标对应的平面位置绑定对应的指示器3. 使用Shader Graph创建网格可视化3. 网格的大小缩放和颜色控制4. 优化5. 扩展说明5.1 我们就可以通…

springboot 多数据源配置

1.引入相关pom文件 <!-- spring boot 启动 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter</artifactId><exclusions><exclusion><artifactId>log4j-api</artifactId&…

(Linux)查看端口占用并关闭进程

1、查看端口占用 netstat -anp |grep 端口号 → 列出所有端口-a或--all&#xff1a;显示所有连线中的Socket&#xff1b;-n: 显示数字地址-p: 显示程序的PID和名称 netstat -tunlp |grep 3306 → 端口号netstat -tunlp |grep mysql → 进程名称netstat -tunlp |grep 29520 →…

智能照明控制系统在体育场馆项目中的应用

摘要&#xff1a;在智能化时代&#xff0c;运用智能技术设计照明已经成为社会发展的关键组成。文章简单介绍了智能体育场馆的含义&#xff0c;然后围绕智能照明系统的基本要求&#xff0c;从灯具选型、灯具配光的光线选择与瞄准、灯具眩光与外溢光控制&#xff1b;基本控制方式…