OpenGPT2.0笔记

2023-11-09

还没看完,先放上来,这个乱七八糟的草稿笔记在这就能提醒自己抓紧看....

GPT Feature

large transformer-based language model 

Training objective: predict the next word, given all of the previous words within some text.

GPT-2在question answering, reading comprehension, summarization, and translation上,尽管表现不好,但是用足够的数据和计算量是可以直接做无监督学习的。

GPT-2 begins to learn these tasks from the raw text, using no task-specific training data. While scores on these downstream tasks are far from state-of-the-art, they suggest that the tasks can benefit from unsupervised techniques, given sufficient (unlabeled) data and compute.

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OpenGPT2.0笔记 的相关文章

随机推荐

  • 个人python笔记

    个人PYTHON记录 更新中 前言 一 个人对python及C uibot的评价 二 python使用包与函数的记录 1 环境的配置anaconda与pycharm 2 py打包为exe 3 excel表格相关包xlwings 4 re正则
  • 根据ID获取问题

    定义接口 根据问题的ID查询一个问题数据 Question getQuestionById Integer id 实现接口 Override public Question getQuestionById Integer id select
  • Web基础知识

    为啥我啥都不知道 在计算机网络技术中 通常涉及两张网 Network和Web Network 主要指硬件网络 包括了TCP IP Transmission Control Protocol Internet Protocol 四层网络体系中
  • tf.nn.conv2d() 参数说明

    tf nn conv2d用法详解 tf nn conv2d 我们已经知道这个函数是用于做二维卷积的 但是他容易和tf layers conv2d 混淆 对于初学者来说 他的参数也不是那么容易理解 只是了解到一点皮毛 并不能一下子就记住 下面
  • Java测试(7)---项目篇

    需求 项目 1 项目启动 了解项目背景 2 需求分析 功能需求 1 文件类型 支持所有文件 2 压缩文件个数 最多压缩100个文件 3 压缩大小 不超过5G 性能需求 1 压缩 解压缩文件不超过30分钟 2 安全需求 带有病毒感染的文件不能
  • 代码随想录算法训练营第四天

    LeetCode 24力扣 两两交换链表节点 采用原地交换 使用tmp节点进行交换前临时节点存储即可 三个一组 package algor trainingcamp import algor junior algor list ListNo
  • MIPI信号简单介绍

    1 MIPI介绍 MIPI是由ARM Nokia ST IT等公司成立的一个联盟 旨在把手机内部的接口如存储接口 显示接口 射频 基带接口等标准化 减少兼容性问题并简化设计 MIPI联盟通过不同的工作组 分别定义一系列手机内部的接口标准 如
  • 字节流与字符流的区别及相互转换

    先来看一下流的概念 在程序中所有的数据都是以流的方式进行传输或保存的 程序需要数据的时候要使用输入流读取数据 而当程序需要将一些数据保存起来的时候 就要使用输出流完成 程序中的输入输出都是以流的形式保存的 流中保存的实际上全都是字节文件 字
  • EL表达式javaweb

    一 JavaBean JavaBean是Java开发语言中一个可以重复使用的软件 它本质上就是一个Java类 为了规范 JavaBean 的开发 Sun 公司发布了 JavaBean 的规范 它要求一个标准的 JavaBean 组件需要道循
  • MeterSphere入参加密踩坑记录

    需求 应公司要求需把项目接口接入MeterSphere Jenkins部署时实现接口自动化测试 项目接口有统一加密方式 所以想写一个统一的前置脚本 减少工作量 ps 我想实现的效果是body里放明文参数 经过前置脚本操作后 把处理后的参数放
  • 如何设置Alfred的Terminal为iterm2

    按以下步骤操作即可 不需要保存 代码立即生效 将以下代码放到上图所示中 on alfred script q if application iTerm2 is running or application iTerm is running
  • Nginx添加nginx_upstream_check_module主动健康检查模块步骤

    1 进入nginx第三方模块存放目录 没有就创建 cd usr local nginx module 下载nginx upstream check module wget https codeload github com yaoweibi
  • 树莓派(Raspberry pi) 使用Pi Imager安装烧录操作系统

    树莓派 Raspberry pi 安装烧录操作系统 最好的方式 土壕的方式 是直接购买了安装好了操作系统的SD卡 拿到树莓派后的第一件事情就是安装烧录操作系统 安装的过程非常简单 在树莓派官方网站上有手把手的安装说明 英语过关的可以直接看
  • 【AI画画教程】无整合包使用LoRA和Dreambooth训练全流程详解(Linux)

    前言 本教程遵循简单原则 不使用任何民间整合包 目前很多AI画画训练整合包臃肿复杂 教程也是名词乱炖 容易对初学者造成理解误差和使用困难 因为许多整合包都依赖于sd scripts库 它自身就能支持绝大多数的训练场景 学会这个后 自己也可以
  • C语言打印9*9乘法表

    C语言9 9乘法表 2d 右对齐 2d 左对齐
  • 《Centos系统——shell脚本判断语句》

    目录 一 掌握表达式测试包括字符串测试 整数测试 文件测试及逻辑测试 1 掌握字符串测试 a 格式 b 例子 2 掌握整数测试 a 格式 b 例子 3 掌握文件测试 a 格式 opr file b 例子 4 掌握逻辑测试 多重判断 b 例子
  • 07-Redis缓存设计

    上一篇 06 Redis缓存高可用集群 1 缓存穿透 缓存穿透是指查询一个根本不存在的数据 缓存层和存储层都不会命中 通常出于容错的考虑 如果从存储层查不到数据则不写入缓存层 缓存穿透将导致不存在的数据每次请求都要到存储层去查询 失去了缓存
  • 当从 Java 进程查看时该主机的主机名称和规范名称不一致。

    查看日志发现是node27 data com 和node27不一致 sed i s data com etc sysconfig network service network restart 最后还没好 第二天我又重新设置了 vim et
  • 基于STM32CubeMX的HC-05蓝牙主从通讯

    基于STM32CubeMX的HC 05蓝牙主从通讯 开发板使用的是stm32f103c8t6 使用STM32CubeMX进行配置 实现两HC 05蓝牙之间主从通讯 HC 05蓝牙模块是主从一体的 两个HC 05之间一主一从通讯 要进入AT模
  • OpenGPT2.0笔记

    还没看完 先放上来 这个乱七八糟的草稿笔记在这就能提醒自己抓紧看 GPT Feature large transformer based language model Training objective predict the next