transformers学习笔记3

2023-11-08

创建model的方法

automodel创建预训练模型

  1. 使用automodel直接创建,使用的是hug face官网上的预训练好的模型参数,完成创建后再使用自己本地的数据集进行迁移训练

  1. automodel api 去官网上下载用户指定类型模型的config file 和model file,config说明了如何创建模型,model包括该模型的参数。

  1. automodel api首先根据config去创建model类,再实例化model并随机初始化其参数

  1. 最后采用model file里面的参数来修改model 实例

  1. 代码:

import transformers

model = AutoModel.from_pretrained("bert-base-uncased") 
  1. config的样子:它是创建模型的蓝图

autoconfig创建初始化模型

  1. autoconfig api 直接去官网下载相应的模型的config file,并且按照该标准初始化一个config class,使用该config class可以实例化一个模型,但此时模型是随机初始化的,需要用户自己找大量数据去从头开始训练,很麻烦、不环保

  1. 代码:

import Transformers

my_config = AutoConfig.from_pretrained("bert-base-uncased")
model = AutoModel(my_config)
  1. 使用特定类创建模型,不推荐这样做,因为实际做项目的时候总是换各种模型,还是推荐用auto api

from Transformers import BertConfig

my_config = BertConfig.from_pretrained("bert-base")
model = BertModel(my_config)
  1. 在创建模型的时候还可以自己修改参数:

import Transformers

my_config = BertConfig.from_pretrained("bert-base")
# my_config = BertConfig()

model = BertModel(my_config, num_hidden_layers=10)

保存model的方法

from Transformers import BertConfig

my_config = BertConfig.from_pretrained("bert-base")
model = BertModel(my_config)

# training model

# 保存模型
model.save_pretrained("directory_on_my_computer")

# 重新加载自己训练的模型
model2 = BertModel.from_pretrained("directory_on_my_computer")

在directory_on_my_computer文件夹下有这两个文件:

  1. config.json

  1. pytorch_model.bin

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

transformers学习笔记3 的相关文章

随机推荐

  • java中的跳转_Java中程序跳转关键字详解

    Java中的goto是保留字 目前不能使用 虽然没有goto语句可以增强程序的安全性 但是也带来很多不便 比如说 我想在某个循环知道到某一步的时候就结束 现在就做不了这件事情 为了弥补这个缺陷 Java就提供了break continue和
  • java.lang.NoClassDefFoundError: Could not initialize class xxx 原因及解决方法

    NoClassDefFoundError产生的原因有好几种 这里记录静态变量或静态块引起的 具体抛出的异常类似 java lang NoClassDefFoundError Could not initialize class xxx JV
  • 将C++数字类型转换成字符串

    include
  • SpringBoot2.x 集成 AntiSamy 防御XSS攻击

    AntiSamy是OWASP的一个开源项目 通过对用户输入的HTML CSS JavaScript等内容进行检验和清理 确保输入符合应用规范 AntiSamy被广泛应用于Web服务对存储型和反射型XSS的防御中 XSS攻击全称为跨站脚本攻击
  • SourceTree如何修改账号密码

    修改SourceTree账号或密码 修改账号 找到 C Users Administrator AppData Local Atlassian SourceTree 中的 userhosts 文件 删除其中要修改的账户 返回SourceTr
  • MySQL WHERE语句筛选操作符

    使用SELECT语句但不使用WHERE子句在表中查询数据 则会获取表中的所有行记录 这些行记录中大部分是不想要的行记录 WHERE子句允许根据指定的过滤表达式或条件来指定要选择的行 1 等于 等于 几乎任何数据类型都可以使用它 2 lt g
  • 小程序坑录-wx.getLocation接口申请

    最近在用uni app通用框架做h5和小程序 结果在小程序审核的时候 又遇到了很多天坑 故记录之 从2022 年 7 月 14 日开始 使用位置接口 就必须在app json中进行声明了 除此之外 在正式使用时 还需要在开发管理 接口权限内
  • 期货开户关于基本面量化

    一 库存 供求矛盾看库存 东西没有了 缺了 就会涨价 不缺 一般不会涨 所以 一定要注意库存 去库存快的品种 特别是库存低 价格低的品种 要重点关注 库存有一点要特别注意 要是 有效去库存 通过降价让下游买货 这种 去库存 不是根本 因为库
  • Leetcode:链表刷题(7道经典题目)

    Leetcode 链表刷题 7道经典题目 本文带来的是以链表为主题的一些经典题目 203 移除链表元素 707 设计链表 206 反转链表 24 两两交换链表中的节点 19 删除链表的倒数第 N 个结点 面试题 02 07 链表相交 142
  • Redis设置失效时间

    Redis设置失效时间还有nx和nxx 通过设置失效时间 可以将到达规定时间对应的key和value进行删除 设置失效时间的两种方式 1 在设值的时候设置失效时间 set code test ex px 秒 毫秒 时间 数值 set cod
  • 深度学习 FairMOT多目标跟踪(PANDA)

    FairMOT 复赛期间对于多目标跟踪任务使用的baseline 本质属于联合学习检测和嵌入模型 Joint Detection and Embedding JDE 毕设项目演示地址 链接 毕业项目设计代做项目方向涵盖 目标检测 语义分割
  • 关于航模的几点积累(四)关于螺旋桨

    关于固定翼飞行器的螺旋桨 1 螺旋桨的几种类型 按材质 塑料 木质 碳纤维 玻璃纤维 尼龙等 按桨叶数量 单叶桨 双叶桨 三叶桨等 按固定方式 快拆桨 大孔桨 适配子弹头 小孔桨 适配螺旋桨保护器 这几种螺旋桨之间的对比分析 2 螺旋桨的重
  • 计算机软件工程操作系统期末复习题

    1 计算机操作系统的功能是 D A 把源程序代码转换为目标代码 B 实现计算机用户之间的相互交流 C 完成计算机硬件与软件之间的转换 D 控制 管理计算机系统的资源和程序的执行 在现代计算机系统中 用户用高级语言编写的源程序必须通过编译程序
  • Elasticsearch Head的使用

    目录 概述 一 安装 Elasticsearch Head 二 解压文件 三 安装Elasticsearch Head依赖 四 启动 Elasticsearch Head 五 修改Elasticsearch Head启动端口号 六 使用 E
  • STM32的PWM控制4个舵机

    本人虽然接触STM32快半年了 但是最近才开始系统的学习STM32 建议一边学 一边做东西 能够更快的提升自己 我用的定时器是TIM3 所以我会把我出现的问题 分享给大家 希望大佬多多指教 因为我先进行部分映射 但是控制某个舵机的PB4引脚
  • 【SVN内网穿透】远程访问Linux SVN服务

    文章目录 前言 1 Ubuntu安装SVN服务 2 修改配置文件 2 1 修改svnserve conf文件 2 2 修改passwd文件 2 3 修改authz文件 3 启动svn服务 4 内网穿透 4 1 安装cpolar内网穿透 4
  • 【微信公众号对接】有关签名一直报错,提示invalid signature问题(我的签名和使用微信开发者工具验证返回的签名的是一致的)但还是报错!!!

    今天对接公众号 一直提示我签名有问题 但是我的签名和官方生成的签名一致 下面是对应数据比对 我的签名 微信官方提供签名 经过比对 两者是一致的 但是 就是一直提示错误 后面是解决思路 1 首先是需要在公众号管理平台配置对应服务器信息 包含白
  • 软件测试大作业 题目 网站测试,[软件分析与测试大作业] 测试性分析软件

    软件分析与测试 考试大作业 1 假设某单位内部电话号码由三部分组成 分别是 分机号 前缀 后缀 其中 分机号为空白或一位数字 前缀为非 0 开头的二位数字 后缀为非全0的3位数字 假定被测程序能接受一切符合上述规定的电话号码 拒绝所有不符合
  • 2023牛客暑期多校训练营7 I-We Love Strings (分块)

    文章目录 题目大意 题解 参考代码 题目大意 题解 这题给定的 n n n 大小和 s i s i si 的总长度有玄机
  • transformers学习笔记3

    创建model的方法 automodel创建预训练模型 使用automodel直接创建 使用的是hug face官网上的预训练好的模型参数 完成创建后再使用自己本地的数据集进行迁移训练 automodel api 去官网上下载用户指定类型模