文本标注平台 doccano 安装教程

2023-11-08

doccano简介

doccano 是一个开源的文本注释工具。它为文本分类、序列标记和序列到序列任务提供注释功能。因此,可以为情感分析、命名实体识别、文本摘要等创建标记数据。只需创建一个项目,上传数据并开始注释。

安装

本文是基于window平台,通过anaconda3安装的。

第一步:首先在anaconda3床架虚拟doccano环境

conda create -n doccano python=3.9

安装结束,提示激活环境: 

注意:Python版本最好为3.9+。

第二步:然后激活doccano环境

conda activate doccano

显示如图表示激活成功:

 第三步:安装doccano

pip install doccano

如果安装速度较慢,可以使用如下命令

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple doccano

耐心等待安装完成即可。

运行

第一步:初始化doccano,在doccano环境下运行

doccano init

安装成功如下: 

第二步:初始化成功之后,创建用户名和密码:

doccano createuser --username admin --password pass

第三步:开启web服务

doccano webserver --port 8000

第四步:打开另外一个cmd命令框,进入到doccano环境,运行以下命令

doccano task

现在就可以在浏览器输入网址查看了

http://127.0.0.1:8000/

 到此doccano安装成功。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

文本标注平台 doccano 安装教程 的相关文章

  • 使用Python开发Web应用程序

    我一直在用 python 做一些工作 但这都是针对独立应用程序的 我很想知道 python 的任何分支是否支持 Web 开发 有人还会建议一个好的教程或网站吗 我可以从中学习一些使用 python 进行 Web 开发的基础知识 既然大家都说
  • Python BigQuery 存储。并行读取多个流

    我有以下玩具代码 import pandas as pd from google cloud import bigquery storage v1beta1 import os import google auth os environ G
  • 如何在python中读取多个文件中的文本

    我的文件夹中有许多文本文件 大约有 3000 个文件 每个文件中第 193 行是唯一包含重要信息的行 我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数 该函数返回给定目录中所有文
  • 如何在刻度标签和轴之间添加空间

    我已成功增加刻度标签的字体 但现在它们距离轴太近了 我想在刻度标签和轴之间添加一点呼吸空间 如果您不想全局更改间距 通过编辑 rcParams 并且想要更简洁的方法 请尝试以下操作 ax tick params axis both whic
  • 使用 openCV 对图像中的子图像进行通用检测

    免责声明 我是计算机视觉菜鸟 我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子 我的用例有点不同 因为我不希望它是具体的 而且我不确定如何做到这一点 如果可能的话 但我感觉应该如此 我有大量图像数据集 有时 其中一些图像是数据集的
  • 导入错误:没有名为 _ssl 的模块

    带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
  • SQL Alchemy 中的 NULL 安全不等式比较?

    目前 我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较 其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
  • 为 pandas 数据透视表中的每个值列定义 aggfunc

    试图生成具有多个 值 列的数据透视表 我知道我可以使用 aggfunc 按照我想要的方式聚合值 但是如果我不想对两列求和或求平均值 而是想要一列的总和 同时求另一列的平均值 该怎么办 那么使用 pandas 可以做到这一点吗 df pd D
  • Python tcl 未正确安装

    我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
  • IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

    我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误 线程 main java lang NoClass
  • Python 中的二进制缓冲区

    在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区 内存映射文件 https docs python org library mmap
  • NameError:名称“urllib”未定义”

    CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
  • Abaqus 将曲面转化为集合

    我一直试图在模型中找到两个表面的中心 参见照片 但未能成功 它们是元素表面 面 查询中没有选项可以查找元素表面的中心 只能查找元素集的中心 找到节点集的中心也很好 但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中 而且我找不到
  • Python:字符串不会转换为浮点数[重复]

    这个问题在这里已经有答案了 我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
  • ExpectedFailure 被计为错误而不是通过

    我在用着expectedFailure因为有一个我想记录的错误 我现在无法修复 但想将来再回来解决 我的理解expectedFailure是它会将测试计为通过 但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是 当我
  • Python - 按月对日期进行分组

    这是一个简单的问题 起初我认为很简单而忽略了它 一个小时过去了 我不太确定 所以 我有一个Python列表datetime对象 我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量 也许一个例子可以更好地证明这
  • Numpy 优化

    我有一个根据条件分配值的函数 我的数据集大小通常在 30 50k 范围内 我不确定这是否是使用 numpy 的正确方法 但是当数字超过 5k 时 它会变得非常慢 有没有更好的方法让它更快 import numpy as np N 5000
  • 在 Pandas DataFrame Python 中添加新列[重复]

    这个问题在这里已经有答案了 例如 我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在 如果我想再添加一个名为 Col3 的列 并且该值基于 Col2 式中 如果Col2 gt 1 则Col3为0 否则为1 所以
  • Python - 字典和列表相交

    给定以下数据结构 找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出 我可以将列表 不是 dict1 组织到任何其他数
  • 改变字典的哈希函数

    按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

  • docker映射mysql修改字符编码_怎么在docker容器的mysql的编码格式变为utf8

    第一个方法 1 编辑MySql的配置文件 MySql的配置文件Windows下一般在系统目录下或者在MySql的安装目录下名字叫my ini 可以搜索 Linux下一般是 etc my cnf 在 mysqld 标签下加上以下内容 defa
  • 深拷贝浅拷贝的理解

    深拷贝 1 是指拷贝一个对象时 不仅仅把对象的引用进行复制 还把该对象引用的值也一起拷贝 2 源对象与拷贝对象互相独立 其中任何一个对象的改动都不会对另外一个对象造成影响 浅拷贝 1 指的是拷贝一个对象时 仅仅拷贝对象的引用进行拷贝 但是拷
  • “由于内部错误,服务器无法处理该请求。有关该错误的详细信息,请打开服务器上的 IncludeExceptionDetailInFaults (从 ServiceBehaviorAttribute 或从...

    WCF程序中一般出现这样的错误 我们需要在服务端的web config中增加
  • 操作系统与shell

    操作系统与shell 操作系统与shell 一 什么是操作系统 1 什么是kernel 2 什么是shell 二 System Call 补充 用户态与内核态 操作系统与shell 一 什么是操作系统 操作系统 即Operating Sys
  • 一文读懂类加载机制

    类记载过程 多个java文件经过编译打包生成可运行的jar包 最终由java命令运行某个主类的main函数启动程序 这里首先需要通过类加载器把主类加载到jvm 主类在运行过程中如果使用到其他类 会逐步加载这些类 注意 jar包里的类不是一次
  • aws ec2 变更pem_用aws和jira建立一个连续的变更日志

    aws ec2 变更pem So you ve decided to go CI CD You read all about the org changes understand the ins and outs of the develo
  • Qt 如何实现文件类型关联

    何为文件打开关联 比如 一个扩展名为txt的文本 双击之后会调用 notepad exe 进行打开 doc的扩展名会调用word打开等等 咱们今天讲的是如何在Qt所编写的程序实现这个动作 这个关联动作都是记录在注册表中的 1 文件格式注册
  • Matlab函数之ismember,find

    一 ismember函数 1 ismember a b 返回前者是否存在于后者的logical数组 举例 a 1 2 3 4 5 6 b 3 5 6 ismember a b 返回的数组为 0 0 1 0 1 1 ismember b a
  • openldap2.4版本管理员文档中文翻译版

    OpenLDAP2 4管理员指南 文章目录 1 OpenLDAP介绍 2 快速开始指南 1 获得软件 2 解压压缩包 3 阅读文档 4 运行configure 5 编译软件 6 测试编译结果 7 安装软件 8 编辑配置文件 9 导入数据库配
  • 计算机网络 第4章 网络层

    第4章 网络层 网络层 network layer 负责为分组交换网上的不同主机提供通信 在发送数据时 将运输层产生的报文段或用户数据报封装成分组或包进行传送 在TCP IP体系中 分组也叫做IP数据包 或简称为数据报 4 1 网络层的几个
  • 透视投影矩阵的推导

    视锥体 如图 近截面与远截面之间构成的这个四棱台就是视锥体 而透视投影矩阵的任务就是把位于视锥体内的物体的顶点X Y Z坐标映射到 1 1 范围 这就相当于把这个四棱台扭曲变形成一个立方体 这个立方体叫做规则观察体 Canonical Vi
  • 如何在visio中画虚线框以及如何解决将visio图形复制到word文档中虚线变为实线的问题

    这两个问题都不是什么复杂的事情 但是如果对visio用的不多或者只是临时用起来碰到了这种问题还真是麻烦事儿 问题1 如何在visio中画虚线框 在上方的按钮中找到矩形工具那个按钮 对 点一下就可以在作图区画出来一个矩形了 可是这个矩形默认的
  • Ubuntu20.04部署GitLab

    安装 更新本地包 安装相关依赖 sudo apt update sudo apt install ca certificates curl openssh server postfix 安装postfix 邮件服务器 时可能出现激活gitl
  • 【开发工具】配置环境变量

    配置环境变量目录 一 环境变量的作用 二 环境变量的配置 一 环境变量的作用 当系统运行一个程序时 除了在当前目录下面寻找此程序外 还会到环境变量中的指定路径寻找 所以将程序的路径设置到环境变量 可以让程序在计算机的任意位置都可以运行 二
  • set-ExecutionPolicy‘ 不是内部或外部命令,也不是可运行的程序 或批处理文

    set ExecutionPolicy 不是内部或外部命令 也不是可运行的程序 或批处理文 1 打开Windows PowerShell ISE 在搜索框内搜索windows powershell ise 然后右击以管理员身份运行 2 输入
  • 315-Leetcode 希尔排序

    希尔排序也叫缩小增量 算法描述 希尔排序是间隔式的分组 5 3 1 利用直接插入排序进行排序 通过缩小分组 排序 再分组 再排序 直到缩为1组 完全有序为止 一趟希尔排序 gap为组数 间隔 分为5组 间隔数就是5 分为3组 间隔数就是3
  • sqlServer 常用查询语句

    查询语句 select 字段 from 表名 where 条件 select 字段 from 表名 where 字段 like 值 select distinct 字段 from 表名 排序查询 select 字段 from 表名 wher
  • 金山卫士开源软件之旅(九) KUI高级界面(列表控件、树控件例子、超文本、网页控件)

    转载自 http blog csdn net b2b160 article details 6275839 reply 注意 作者的例子及代码是基与上一版本的金山库 XML的语法及有些API名字不一样 本篇开始介绍比较复杂的界面应用了 界面
  • MySQL -- 获取某一字段数据的后几位! (SUBSTRING)

    select SUBSTRING id 3 from user 取id字段后三位字符 select SUBSTRING id 3 from user 从左开始第3位取 包括第三位
  • 文本标注平台 doccano 安装教程

    doccano简介 doccano 是一个开源的文本注释工具 它为文本分类 序列标记和序列到序列任务提供注释功能 因此 可以为情感分析 命名实体识别 文本摘要等创建标记数据 只需创建一个项目 上传数据并开始注释 安装 本文是基于window