AI夏令营(第三期)NLP 任务二

2023-11-14

在阿里云的机器学习平台PAI上跑的

机器学习PAI_机器学习建模训练部署_智能推荐_人工智能_阿里云 (aliyun.com)

获取预训练模型时出现问题(error:104 Connection reset by peer)所以修改部分代码

  • 前置依赖增加
#import 相关库
#导入前置依赖
from transformers import BertTokenizer # 使用离线bert
  •  使用离线bert(需先下载)
#获取Bert预训练模型
# tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
tokenizer = BertTokenizer.from_pretrained('./bert-base-uncased')

 下载bert

git clone https://huggingface.co/bert-base-uncased # 终端

使用时还会报错:OSError: You seem to have cloned a repository without having git-lfs installed. Please install git

apt-get update
apt-get install git-lfs
git init
git lfs install
cd ./bert-base-uncased # 进入bert所在文件夹
git lfs pull

重启一下环境就可以运行啦(当然如果刚进入就完成这些操作,也不用重启了)

  • 其他小问题:大概是baseline不小心打错了,在数据预处理时出现了未定义的“test”
# test['Keywords'] = test['title'].fillna('')
test_data['Keywords'] = test_data['title'].fillna('')

然后,就开始跑啦——

validation loss前期有低有高,后期一路升高,有待仔细研究

total随训练次数增加而降低,在epoch==90,step==167的时候,total loss就为0.0000了 

感觉努努力还可以再高点(flag)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AI夏令营(第三期)NLP 任务二 的相关文章

随机推荐

  • 结构体字节对齐问题

    文章目录 一 结构体必知知识 二 结构体字节对齐有什么用 三 如何进行内存对齐 1 对齐规则 按结构体中最长类型字节为单位 2 结构体嵌套的情况 3 存在指定字节对齐单位的情况 pragma pack 总结 一 结构体必知知识 1 结构体内
  • Git 常用命令小结 -- 个人

    一 Git 放弃本地修改 强制pull代码 git fetch all git reset hard origin 分支 git pull 二 Git 基础命令 git status git diff 查看代码修改的状态和内容 git br
  • CAN初始化流程

    1 配置相关引脚的复用功能 使能CAN时钟 要用CAN 首先要使能CAN的时钟 CAN的时钟通过APB1ENR的第25位来设置 其次要设置CAN的相关引脚为复用输出 这里我们需要设置PA11位上拉输入 CAN RX引脚 PA12为复用输出
  • ubuntu14 java8_ubuntu14.04 安装Java8 (JDK8)

    目前腾讯云服务器 Ubuntu 14 04 系统用 sudo apt get install default jdk 安装的JDK还是 java 7的 会导致一些对于需要Java 8 支持的一些应用无法编译或者运行 所以 目前还需要自己手动
  • 浅谈后台管理系统

    一 后台是什么 二 模块管理 三 角色管理 四 账号管理 五 密码管理 六 更多讨论 一 后台是什么 后台不是某个独立系统 是多个模块的组合 并且之间还有信息交互 所以后台的设计对于PM要求一般较高 后台是用来数据维护的 后台需要一个管理模
  • 学了那么多年设计模式依然不会用!那可真蠢!

    什么是设计模式 设计模式 Design Pattern 代表了最佳的实践 通常被有经验的面向对象的软件开发人员所采用 设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案 这些解决方案是众多软件开发人员经过相当长的一段时间的试验和
  • 调试最长的一帧(第21天)

    看看全流程 主要讲sceneview cull 跟过去 重点在cullstage 状态树与渲染树的构建都是在pushStateSet和popStateSet函数中完成的 而CullVisitor apply函数 在遍历节点时调用 则负责根据
  • vnc远程管理kvm,在办公室连接kvm服务器

    文章目录 vnc远程管理kvm vnc远程管理kvm vnc概念图 首先试试服务器装了VNC没 rpm q tigervnc tigervnc server 没安装的话会直接出现 package tigervnc is not instal
  • getopt()与getopt_long()的使用简介

    感性认识 getopt 与getopt long 是专门处理命令行参数的两个函数 getopt 处理短参数 getopt long 处理长参数 还不明白请看下面这张图 解析 t yiqi 就是这两个函数做的事 下面我们一起来看看究竟如何使用
  • 查看电脑连接的wifi密码

    一 常规方法查看电脑连接的wifi密码 1 使用电脑连接需要查看的WiFi 鼠标右击电脑桌面右下角 WiFi图标 在弹出的菜单中点击 打开 网络和internet 设置 2 在弹出的设置窗口中点击 网络和共享中心 如下图所示 3 在弹出的网
  • MSP430F149小系统开发板实现RS232串口通信

    程序功能 MCU不停向PC机发送数据 在屏幕上显示0 127对应 的ASCII字符 通信格式 N 8 1 2400 测试说明 打开串口调试精灵 正确设置通信格式 观察屏幕 调试说明 该程序通过USB口 在sscom32上可以观察到现象 用的
  • 2022年十月份电赛OpenMV巡线方案详细代码分析(1)

    前言 1 马上要进行电赛了 机器识别是铁定会使用到的 为了防止出现去年十月份那种特殊的巡线方案 我在此分享出OpenMV巡线方案 并且进行讲解和分析如何更改 2 学习本文之前 需要学习 OpenMV串口通讯详解 OpenMV图像处理之后给单
  • Java的多重循环

    多重循环 1 打印图案 经过打印分析 外层循环控制行数 内层循环控制列数 打印三角形 第一行元素的个数决定了计数器的初始值 如果元素是越来越多 那么计数器变化为 当计数器为 我们必须设置一个上限 也就是判断条件必须小于或者小于等于某个值 如
  • 5款优秀的开源 CSS3 动画库,助你轻松地实现各种动画效果,让网页不再单调

    CSS 动画主要通过Transition 过渡 和Animation 关键帧动画 实现 是一种非常实用和流行的网页设计技术 可以帮助用户实现丰富多彩的动画效果 提升用户体验和页面互动性 CSS 动画具有简单 轻量 易用等特点 可以在不依赖
  • 【网络原理】UDP和TCP协议重点知识汇总

    目录 1 UDP协议 2 TCP协议 1 UDP协议 UDP协议的特点 无连接 不可靠传输 面向数据报和全双工 UDP报文最大长度是2个字节 2个字节表示的范围就是0 65535 也就是64kb 所以如果需要使用UDP传输一个比较大的数据
  • html+css实现3D相册

  • VSCode执行Python程序出错:vscode conda activate激活失败

    VSCode执行Python程序出错 vscode conda activate激活失败 1 vscode conda activate激活失败 C Users 17316 gt conda activate CommandNotFound
  • Android 11 添加系统服务SystemService

    添加自定义的systemservice 到时候就可以直接getSystemService这样使用了 1 添加AIDL 在frameworks base core java android os 下新建一个aidl文件 package and
  • 我整理了十套 SpringBoot 项目完整教程「源码+视频+讲义」

    1 基于Springboot Vue的音乐项目 源码 详细视频 视频原创 系统的演示 系统的视频非常详细 都是我们自己录制的 也都免费分享 2 基于SSM的商城系统 源码 详细视频 系统的教程如下所示 免费分享 系统的界面如下所示 3 基于
  • AI夏令营(第三期)NLP 任务二

    在阿里云的机器学习平台PAI上跑的 机器学习PAI 机器学习建模训练部署 智能推荐 人工智能 阿里云 aliyun com 获取预训练模型时出现问题 error 104 Connection reset by peer 所以修改部分代码 前