机器学习——自然语言处理(一)

1 分词

1.1 设计原则

切分粒度大;非字典词少、单字字典词少;总体次数少。

1.2 基于词典匹配的分词

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.3 基于语法和规则的分词

目前处在试验阶段

1.4 基于统计的分词

1.5 技术难点

1.5.1 歧义识别

交集型歧义:AB | C or A | BC
组合型歧义:AB or A | B

交集型歧义更为常见,也相对更容易处理。

1.5.2 新词识别

2 词性标注

2.1 问题描述

在这里插入图片描述
在这里插入图片描述

这里实际是把词性当作状态,词当作观测序列,于是问题抽象成了由观测序列推状态,与 HMM 中的第二个基本问题有了很好的对应。事实上,HMM 也是解决词性标注的主要方法。

3 命名实体的识别

3.1 主要任务

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/2636.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

逆向(异或)

在学习逆向前我们需要掌握一些汇编的基础知识的 同时我们得知道可执行文件的原理 计算机生成可执行文件,我们大致可以简单的这么理解 1.asm源程序文件 2.asm源程序生成obj也就是目标文件 3.由目标文件链接生成可执行文件,Windows的可执行文件通常是EXE&a…

【软考网络管理员】2023年软考网管初级常见知识考点(18)-安全协议SSL与PGP、数据加密技术

涉及知识点 安全套接层协议SSL详解,PGP协议是什么?数据加密技术有哪些?软考网络管理员常考知识点,软考网络管理员网络安全,网络管理员考点汇总。 原创于:CSDN博主-《拄杖盲学轻声码》,更多考点…

优思学院|什么是六西格玛黑带?

六西格玛黑带,这是一个有趣的称谓。这个称号意味着拥有它的人在六西格玛方法和统计工具应用方面有很高的造诣。在企业中,只有中层以上的人才能获得这个称号。 黑带这个词源自跆拳道,因为跆拳道最高段位的人所戴的腰带是黑色的。后来&#xf…

计算机图形硬件(二) 5 - 1 视频显示设备

现在,计算机图形学的功能与应用已经得到了广泛承认,大量的图形硬件和软件系统已经应用到了几乎所有的领域。通用计算机甚至许多手持计算器也已经普遍具备二维及三维应用的图形功能。在个人计算机上也可以配用多种交互输人设备及图形软件包。对于高性能应…

web入门——springboot、HTTP协议

这里写目录标题 springboot入门 http协议概念以及特点请求协议格式请求头的一些含义解释 响应协议格式具体的状态码以及响应头的一些含义解释 协议解析 springboot 入门 http协议 概念以及特点 请求协议 格式 包括请求行、请求头、请求体三部分(请求体是pos请求方…

SpringBoot + Vue前后端分离项目实战 || 一:Vue前端设计

系列文章: SpringBoot Vue前后端分离项目实战 || 一:Vue前端设计 SpringBoot Vue前后端分离项目实战 || 二:Spring Boot后端与数据库连接 SpringBoot Vue前后端分离项目实战 || 三:Spring Boot后端与Vue前端连接 SpringBoot V…

C++中的exec()函数

exec()函数在C中是一个进程控制函数,用于创建新进程执行其他程序或命令行指令。exec()函数可以替换当前进程的代码和数据,创建新的进程运行其他程序。exec()函数有多个版本,例如execl、execv、execle、execve等,根据不同的参数类型…

go-zero的配置及gorm、自定义返回等的引入以及扩展

工程维度(摘自官网) . ├── consumer ├── go.mod ├── internal │ └── model ├── job ├── pkg ├── restful ├── script └── service consumer: 队列消费服务internal: 工程内部可访问的公共模块job&a…

实战:k8s证书续签-2023.6.19(测试成功)

实战:k8s证书续签-2023.6.19(测试成功) 目录 推荐文章 https://www.yuque.com/xyy-onlyone/aevhhf?# 《玩转Typora》 1、前言 k8s集群核心的证书有2套,还有1套非核心的(即使出问题也问题不大)。 ⚠️ 如果是kubeadm搭建的k8s集群,其有效期为…

如何快速判断是否在容器环境

在渗透测试过程中,我们的起始攻击点可能在一台虚拟机里或是一个Docker环境里,甚至可能是在K8s集群环境的一个pod里,我们应该如何快速判断当前是否在容器环境中运行呢? 当拿到shell权限,看到数字和字母随机生成的主机名…

【AICG】【Midjourney】AI自动生成图片的初接触

背景 现在是AI 比较流行,公司也推荐学习和了解AI的相关东西。 公司的内部培训中涉及到了Midjourney的简单讲解。 效果 由于我的账号注册的时候过了free窗口期: 现在要我花钱订阅: 只能看看其他人的帖子过过AI生成的瘾。 如图所示&#x…

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型、ChatGLM2-6B 重磅发布

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息…