【doccano】文本标注工具——安装运行教程

笔记为自我总结整理的学习笔记,若有错误欢迎指出哟~

【doccano】文本标注工具

  • doccano简介
  • 安装doccano
    • 1. 创建并激活虚拟环境
    • 2. 安装doccano
  • 运行Doccano
  • 访问Doccano

doccano简介

doccano是一个开源的文本注释工具。它为文本分类、序列标记和序列到序列任务提供注释功能。您可以为情感分析、命名实体识别、文本摘要等创建标记数据。只需创建项目、上传数据并开始注释即可。你可以在几个小时内建立一个数据集。

Doccano的主要特点包括:

  1. 用户友好的界面:提供直观的界面设计,支持直接在网页上进行文本标注。
  2. 多人协作:支持多人同时进行文本标注和校对,可以提高工作效率。
  3. 多样化的数据格式支持:可以导入和导出多种数据格式,方便用户灵活处理标注数据。
  4. 适用于多种NLP任务:支持文本分类、命名实体识别、关系抽取等多种自然语言处理任务的标注。

安装doccano

基于window平台,通过anaconda3安装(要确保anaconda3安装成功)

1. 创建并激活虚拟环境

  • 打开命令提示符(cmd)或Anaconda Prompt。
  • 创建一个新的Python虚拟环境:
    conda create --name sentiment python=3.9
    
  • 激活虚拟环境:
     conda activate sentiment
    
    在这里插入图片描述

2. 安装doccano

  • 在激活的虚拟环境中,使用pip安装doccano:
    pip install doccano -i https://pypi.tuna.tsinghua.edu.cn/simple
    
    在这里插入图片描述

运行Doccano

  • 初始化数据库。

    doccano init
    

    在这里插入图片描述

  • 创建一个超级用户。

    doccano createuser --username admin --password pass
    

    在这里插入图片描述

  • 启动 Web 服务器,端口号为 8000。

    doccano webserver --port 8000
    

    在这里插入图片描述

  • 在另一个终端中,进入到安装了doccano的sentiment环境,运行命令

    activate sentiment
    doccano task
    

    在这里插入图片描述

访问Doccano

  • 打开浏览器,并访问http://localhost:8000来打开Doccano的登录页面。
  • 使用您创建的超级用户凭据登录并开始使用Doccano。
    在这里插入图片描述

用户名:admin
密码:pass

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/225280.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#中的async/await异步编程模型

前言 当谈到异步编程时,C#中的async/await是一个强大且方便的工具。它使得编写并发和异步操作变得更加简单和可读,同时提供良好的可维护性。本文将详细解释async/await的使用,以及如何在C#中有效地利用它来实现异步操作。 目录 前言1. async…

现货白银交易系统失灵了咋办?

在现货白银交易中,投资者常常会吐槽说,这个交易系统失灵了,并且他们还会感到很紧张,因为系统的失灵,可能意味着投资者策略不能发挥作用,进而出现亏损。其实,在网络时代,尤其是自动交…

SpringBoot : ch08 自动配置原理

前言 在现代的Java开发中,Spring Boot已经成为了一个备受欢迎的框架。它以其简化开发流程、提高效率和强大的功能而闻名,使得开发人员能够更加专注于业务逻辑的实现而不必过多地关注配置问题。 然而,你是否曾经好奇过Spring Boot是如何做到…

MIT_线性代数笔记:第 08 讲 求解 Ax=b:可解性与结构

目录 可解的条件 Solvability conditions on b特解 A particular solution通解 Complete solution与零空间进行线性组合 Combined with nullspace 秩 Rank 可解的条件 Solvability conditions on b 矩阵 A 的第三行为第一行和第二行的加和,因此 Axb 中 b 的第 3 个分…

leetcode面试经典150题——33 最小覆盖子串(滑动窗口)

题目: 最小覆盖子串 描述: 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 “” 。 注意: 对于 t 中重复字符,我们寻找的子字符串中…

Redis应用的16个场景

常见的16种应用场景: 缓存、数据共享分布式、分布式锁、全局 ID、计数器、限流、位统计、购物车、用户消息时间线 timeline、消息队列、抽奖、点赞、签到、打卡、商品标签、商品筛选、用户关注、推荐模型、排行榜. 1、缓存 String类型 例如:热点数据缓存&#x…

c++ opencv使用drawKeypoints、line实现特征点的连线显示

前言 图像经过算子处理后得到若干特征点,使用opencv进行渲染显示出这些特征点并且连线,更直观的对比处理前后的一些差异性 demo核心代码 //画出特征点并连线 void drawFilterLinePoints(cv::Mat& srcMat, cv::Point2f pointStart, cv::Point2f po…

网络运维与网络安全 学习笔记2023.11.28

网络运维与网络安全 学习笔记 第二十九天 今日目标 OSPF汇总之域间路由、OSPF汇总之外部路由、OSPF链路认证 OSPF安全认证之区域认证、OSPF虚链路 OSPF汇总指域间路由 项目背景 企业内网运行多区域的OSPF网络,在R1 上存在多个不稳定的链路 R1上的不稳定链路&a…

详解HTTP协议(介绍--版本--工作过程--Fiddler 抓包显示--请求响应讲解)

目录 一.HTTP协议的介绍 1.1HTTP是什么? 1.2HTTP版本的演变 二.HTTP的工作过程 三.使用Fiddler抓包工具 3.1简单讲解Fiddler 3.2Fiddler工作的原理 3.3抓包结果分析 四.HTTP请求 4.1认识URL 4.2关于URL encode 4.3认识方法 4.3.1认识get和post 4.3.…

Python 爬虫 案例 之 豆瓣Top250电影数据

前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 如果有什么疑惑/资料需要的可以点击文章末尾名片领取源码 课程亮点: 1、动态数据抓包演示 2、csv文件保存 3、requests模块的使用 4、parsel解析数据的使用 环境介绍: python 3.8 pycharm 模块…

【JMeter】配置元件

1. 元件的分类 HTTP Request Default 作用: 可以配置成通用的信息,可复用 ​​​​​​​ JDBC Connection Configuration 作用:连接数据库 前提: 下载好对应数据类型的jar包 ​​​​​​​ HTTP Header Manager信息头管理…

shell编程系列- bash和sh的区别

文章目录 引言bash和sh的区别CentOS下的区别Ubuntu下的区别 最佳实践 引言 我们在编写shell脚本时,通常第一行都要声明当前脚本的执行程序,也就是常见的 #!/bin/sh 或者是 #!/bin/bash ,我们无论用哪一个脚本似乎都可以正常的执行&#xff0…