ChatGPT 相关资料收集

2023-05-16

本文地址:blog.lucien.ink/archives/538

本文用来收集各种和生成式模型相关的内容,由于 ChatGPT 是其代表,也是会被写入人类历史进程的一个名字,所以便用 ChatGPT 作为标题的一部分,以表示我对 OpenAI 团队由衷的敬佩。

2023-04-02 更新

  • Improving Language Understanding by Generative Pre-Training (2018)

    • 介绍了 GPT 的结构和训练方式,文章提到未来可以继续拓展的几个方向。其中一个便是模型在 ZERO-SHOT 的设定下,模型的表现与堆叠的解码器层数有直接的正相关性。
  • Language Models are Unsupervised Multitask Learners (2019)

    • 文章认为对单任务单领域的训练是模型缺乏泛化能力的主要原因,实践验证仅靠预训练 + 提示 + 预测就在8/9个任务里达到了SOTA。
  • Language Models are Few-Shot Learners (2020)

    • 继续探索了在不对下游任务进行适配(模型结构不更改、参数不更新)的情况下,模型的表现。
  • Training language models to follow instructions with human feedback (2022)

    • 探索了指示学习和基于人工反馈的强化学习训练,基本上约等于 ChatGPT。
  • LoRA: Low-Rank Adaptation of Large Language Models (2021)

    • 提出通过训练一个低秩参数矩阵来进行模型微调,相较于直接微调整个模型,能在损失较少精度的情况下大幅降低训练成本。
  • Self-Instruct: Aligning Language Model with Self Generated Instructions(2022)

    • 让模型尝试通过半监督的方式自己去生成指令样本,能取得不错的效果。
  • LLaMA: Open and Efficient Foundation Language Models

    • 训练了从 7B 到 65B 的一组模型,全部贡献给开源社区,且 LLaMA-13B 在多数基准测试中优于 GPT-3(175B)。
    • 验证了公开数据集的可行性,以及小模型(相比 OpenAI 的规模)的潜力。
    • 开源模型地址:huggingface.co/decapoda-research
  • Stanford Alpaca: An Instruction-following LLaMA Model

    • 花了 $500 去调用 OpenAI 的 text-davinci-003 并收集数据,然后用这些数据花了 $100 来微调 LLaMA-7B 模型,得到了一个效果还不错的模型,取名为 Alpaca,模型未开源。
    • 公开了生成数据的代码,以及对应的数据集:alpaca_data.json
  • Guanaco: A Multilingual Instruction-Following Language Model Based on LLaMA 7B

    • 同样是对 LLaMA-7B 进行微调,不同的是在 alpaca_data.json 的基础上增加了对繁简体中文及日语的指令,共计 534530 条,数据集地址:Guanaco Dataset。
  • Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality

    • 花了 $300 左右,使用 用户共享的数据 来对 LLaMA-13B 进行微调,可以在 GPT-4 的评测 下达到 ChatGPT 90% 的水平。
    • Demo: Vicuna Online Demo,源码:FastChat,暂未公开模型。
    • ShareGPT Github: domeccleston/sharegpt
  • BELLE: Be Everyone’s Large Language model Engine

    • 来自 链家 的技术团队,提供了训练代码、数据、模型,包含一些中文改进。HuggingFace 主页:BelleGroup
  • Chinese-Vicuna: A Chinese Instruction-following LLaMA-based Model

    • 在 LLaMA 的基础上使用 BELLE 和 Guanaco 训练了 lora,提供了代码和训练过的 Lora。HuggingFace 主页:Chinese-Vicuna

暂时先收集这些,总结下来就一句话:OpenAI 不够体面,开源社区帮他体面。以及作为马后炮,我认为在对 GPT 现代化改进的加持下,于多数日常任务来说,10B 左右的规模应该是足够的。

2023-04-04 更新

  • 今天 vicuna 放出了他们的模型:lmsys/vicuna-13b-delta-v0

2023-04-06 更新

  • Koala: A Dialogue Model for Academic Research
    • 主要是使用 EasyLM 提升了训练速度,使用 8 张 A100 完成两轮 epoch 只需要 6 个小时,大大降低了训练成本。评测效果优于 Alpaca,达到 ChatGPT 50% 的性能。

2023-04-09 更新

  • 链家放出了 13B 的模型:BelleGroup/BELLE-LLAMA-13B-2M
    • 同时还放出了更多的数据集
  • 一个跟进 LLM 的 Repo:Awesome-LLM: a curated list of Large Language Model

2023-04-22 更新

当前的开源社区大致有 3 个方向:

  1. 复现 ChatGPT 的效果
  2. 加速(模型轻量化、更底层的训练/推理加速)
  3. 应用(插件、Auto-GPT、ViedoChat、提示魔法)
  • Auto-GPT: An Autonomous GPT-4 Experiment
    • 会上网、使用工具,能根据人类给出的任务,自己定目标、思考、执行。
    • 在线 DEMO:AgentGPT
  • MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models
    • 用小模型复现了 GPT-4 的多模态能力,已开源
    • 项目主页:MiniGPT-4
    • 模型:Vision-CAIR/MiniGPT-4
  • Generative Agents: Interactive Simulacra of Human Behavior
    • 令若干个独立的基于 GPT 的 Agent “生活”在一起,会产生很多类似人类的社会行为
    • DEMO 在国内打不开,在这里只放出论文
  • ChatGPT 中文指南
    • 这是一个很早以前就有的项目,只是每次都得根据回忆去重新搜出来,不如就直接记在这里
  • 复旦大学的 MOSS
    • 昨天(4 月 22 日)刚刚开源,给出了模型、数据、代码
    • 并且 MOSS 支持插件,如科学计算、上网、绘图,据我了解这是开源社区的首次支持
    • 关于插件如何使用,可参考这里:plugin模型,有用python代码写的使用例子吗?而非只是动态图片,截止到写下这行文字,作者还没有实际测试过。

2023-04-23 更新

  • Awesome ChatGPT Prompts
    • ChatGPT 中文指南 的英文版本
  • ChatGPT 学术优化
    • 科研工作专用ChatGPT/GLM拓展,特别优化学术Paper润色体验,模块化设计支持自定义快捷按钮&函数插件,支持代码块表格显示,Tex公式双显示,新增Python和C++项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持gpt-3.5/gpt-4/chatglm
  • Chat with any PDF
    • 可以将 PDF GPT 作为上下文,然后可以问他任何问题,比如摘要、理解、建议等。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGPT 相关资料收集 的相关文章

  • 【Python】使用nexus搭建使用pip仓库

    搭建环境 1 安装nexus3 参考 xff1a Maven 使用nexus搭建maven私有仓库 2 创建Blob Stores Name xff1a pypi Path xff1a 选择存储路径 3 创建Repositories代理 点
  • 【前端】使用nexus搭建本地npm仓库

    搭建环境 1 创建Blob Stores Name xff1a npm 2 创建Repository 创建npm hosted xff0c 填写Blob store xff1a npm 创建npm proxy xff0c 填写Blob st
  • 【Docker】docker指定mac地址启动

    1 使用命令 mac address 61 ae ac ae 71 1c 2c 2 启动示例 docker run d restart 61 always mac address 61 ae ac ae 71 1c 2c name redi
  • 【ICE学习】IceBox管理服务(C#)

    前提条件 xff1a 已安装VS2012和ICE3 5 1 xff0c ICE安装包 xff1a https download csdn net download xmzmqx 12928570 安装搭建环境比较简单 xff0c 请自行百度
  • 1.4编程基础之逻辑表达式与条件分支

    01 判断数正负 总时间限制 1000ms 内存限制 65536kB 描述 给定一个整数N xff0c 判断其正负 输入 一个整数N 109 lt 61 N lt 61 109 输出 如果N gt 0 输出positive 如果N 61 0
  • ubuntu kylin 14.04 中文切换到英文

    1 修改 etc default locale文件 LANG 61 34 en US UTF 8 34 LANGUAGE 61 34 en US en 34 2 修改 etc environment文件 LANG 61 34 en US U
  • 结构体嵌套与结构体指针

    struct和typedef struct 首先是结构体的定义格式 分三块来讲述 xff1a 1 首先 xff1a 注意在C和C 43 43 里不同 在C中定义一个结构体类型要用typedef typedef struct Student
  • python源设置及查看

    记录一下 python 设置源及查看方法 xff1a span class token comment 查看设置 span python m pip config list span class token comment 设置源 span
  • linux环境C++执行bash脚本

    所需头文件 xff1a include lt stdio h gt 例如 xff0c 希望执行脚本 mkdir testDir C 43 43 Code xff1a FILE fp 61 popen 34 mkdir testDir 34
  • Visual Studio 远程调试设置

    VisualStudio远程调试很方便 xff0c 设置也非常简单 远程调试器安装 安装VisualStudio时默认就会安装远程调试器 xff0c 所以一般无需单独安装 被连接方设置 被连接方需要打开远程调试器 xff0c 它位于目录Re
  • 【windows11系统进行ubuntu系统安装详细步骤】

    windows11系统进行ubuntu系统安装详细步骤 2022年新购入一台win11台式电脑 xff0c 进行python的学习经历 xff0c 教程里边要求安装linux系统 xff0c 所以从网上搜索如何安装ubuntu系统 xff0
  • Win7远程控制fedora ——通过xrdp

    原文地址 http blog sohu com s MTU5MTY3OTE1 302888160 html 最近要分析RDP协议的相关东西 xff0c 然后需要抓包 xff0c 实验室空着的电脑只有Fedora系统了 xff0c 就找了一下
  • 解决Win10/11 WSL 子系统 WslRegisterDistribution failed with error: 0x800701bc 错误

    原因 xff1a wsl1升级到wsl2之后 xff0c 内核却没有升级 xff0c 所以会出现这种错误提示 xff01 解决方法 xff1a 1 下载最新的wsl安装包 2 安装包下载后 xff0c 直接运行安装即可 xff01 3 下载
  • 分布式事务之Seata AT 事务

    1 Seata介绍 Seata 是一款开源的分布式事务解决方案 xff0c 致力于提供高性能和简单易用的分布式事务服务 Seata 将为用户提供了 AT TCC SAGA 和 XA 事务模式 xff0c 为用户打造一站式的分布式解决方案 1
  • Vue引用Element-UI时,组件无效果解决方案

    问题 xff1a Vue在使用Element UI组件的时候 xff0c 已经安装好依赖 span class token operator gt span npm install element span class token oper
  • C语言:编译成可执行程序的步骤

    1 预处理 xff08 头文件的展开 xff0c 宏的替换 ifdef else endif xff09 gcc E test c o test i 2 编译 xff08 生成汇编文件 xff0c 对词法和语法进行检查 xff09 gcc
  • 服务器蓝屏的原因及解决办法

    硬件故障 xff1a 1 散热问题 2 内存主板问题 3 电源问题 4 显卡问题 解决办法 xff1a 1 清理下灰尘 xff0c 风扇 xff0c 温度高会蓝屏 2 检查内存 xff0c 新机器后加的内存是不是不兼容 xff0c 拔插下内
  • 在 CentOS 8 中使用 KVM 安装 Windows 10

    在 CentOS 8 中使用 KVM 安装 Windows 10 本文地址 xff1a blog lucien ink archives 514 使用 esxi 的话总觉得有些别扭 xff1f 故尝试 KVM xff0c 本文使用 Cent
  • 树莓派初始化备忘

    树莓派初始化备忘 本文地址 xff1a blog lucien ink archives 515 最近又开始折腾树莓派了 xff0c 记录一下初始化一个树莓派需要做的一些操作 本次操作以 64 位 Raspberry Pi OS xff08
  • 树莓派禁用 Wi-Fi 和蓝牙

    树莓派禁用 Wi Fi 和蓝牙 本文地址 xff1a blog lucien ink archives 516 因为我的树莓派是直接通过网线连接的 xff0c 并没有启用 Wi Fi xff0c 所以在每次 SSH 连进去之后 Raspbi

随机推荐

  • 树莓派安装 OMV

    树莓派安装 OMV 本文地址 xff1a blog lucien ink archives 517 终究还是忍住了 xff0c 没有出手买 x86 的 NAS xff0c 选择自己折腾树莓派 xff08 因为实在是太穷了 xff09 1 初
  • 树莓派安装 docker 和 docker-compose

    树莓派安装 docker 和 docker compose 本文地址 xff1a blog lucien ink archives 518 因为总是频繁地初始化树莓派 xff0c 所以把安装 docker 的过程也记录下来 1 安装 doc
  • 打印 Go Test 的代码覆盖

    打印 Go Test 的代码覆盖 本文地址 xff1a blog lucien ink archives 520 使用方法 将这段代码复制进 zshrc 或者是 bashrc 等文件中 xff08 取决于你的命令行 xff09 xff0c
  • Typecho HTTPS 无法登陆后台

    Typecho HTTPS 无法登陆后台 本文地址 xff1a blog lucien ink archives 523 背景 因为百度云加速的 HTTPS 证书各种难用 xff0c 最近将博客的 CDN 解决方案整体迁移至 Cloud F
  • git 显示中文

    git 显示中文 本文地址 xff1a blog lucien ink archives 524 默认情况下 xff0c git 会对中文进行转译 xff0c 具体表现如下 xff1a span class token function g
  • 在 PVE 中安装 OpenWrt

    在 PVE 中安装 OpenWrt 本文地址 xff1a blog lucien ink archives 525 最近在捣腾 x86 软路由 xff0c 入门方案一般是底层采用 ESXi 或 PVE xff0c 虚拟层使用 iKuai 4
  • ARM:系统移植1

    一 系统移植的概述 1 目的 xff1a 1 软硬件可裁剪 xff1a 硬件发生变化 xff0c 软件要进行裁剪 xff0c 适配硬件 2 学习linux驱动的开发 xff0c 前提开发板上需要运行linux系统 移植linux内核系统到开
  • hdu 3700 cat

    Cat Time Limit 2000 1000 MS Java Others Memory Limit 32768 32768 K Java Others Total Submission s 181 Accepted Submissio
  • OpenWrt 安装中文语言包

    OpenWrt 安装中文语言包 本文地址 xff1a blog lucien ink archives 527 安装 luci i18n base zh cn 即可 xff08 这不是一篇水文 xff09
  • OpenWrt 安装 OpenClash

    OpenWrt 安装 OpenClash 本文地址 xff1a blog lucien ink archives 528 截止 2022 年 5 月 5 日 xff0c OpenWrt 的最新版本为 21 02 3 xff0c OpenCl
  • OpenWrt 添加自定义 Service

    OpenWrt 添加自定义 Service 本文地址 xff1a blog lucien ink archives 530 span class token shebang important bin sh etc rc common sp
  • PVE 虚拟机心跳检测并重启

    PVE 虚拟机心跳检测并重启 本文地址 xff1a blog lucien ink archives 531 不知为何 xff0c PVE 中的 OpenWrt 时不时会宕机 xff0c 这是背景 秉承着能用就行的思想 xff0c 写了一个
  • WSL2 安装、配置 Cuda、pytorch 记录

    WSL2 安装 配置 Cuda pytorch 记录 本文地址 xff1a blog lucien ink archives 532 最近整了张矿卡 xff0c 为了这盘醋 xff0c 包了盘饺子 虽然我已经预料到买前深度学习 xff0c
  • Windows 删除恢复分区

    Windows 删除恢复分区 本文地址 xff1a blog lucien ink archives 533 目前不论是 Windows 10 还是 Windows 11 xff0c 在安装完成后在 C 盘的后面都会有一个恢复分区 xff0
  • Debian 下 CUDA 生产环境配置笔记

    最近整了张 Tesla P4 xff0c 由于是半高卡 xff0c 索性就直接将其塞进了我的 NAS 里 xff0c 试图将原来用 onnx 跑在 CPU 上的模型迁移至 GPU 上 xff0c 遇到了些许问题 xff0c 在此记录下 本文
  • OpenWRT 扩容

    本文地址 xff1a blog lucien ink archives 535 官网原生的 overlay 只有 100M xff0c 不够用 本文只讨论新安装的情形 xff0c 已安装扩容的场景在本文不涉及 步骤 假设从官网下载的文件名为
  • PVE 下解决 iKuai 断流、重启问题

    本文地址 xff1a blog lucien ink archives 536 0 前言 懒得看过程可直接移步第 2 部分 之前入手了 N5105 43 i225 V xff0c 收到后装了 PVE 7 2 作为底层系统 xff0c 虚拟化
  • OpenWRT 安装 PassWall

    本文地址 xff1a blog lucien ink archives 537 访问 OpenWRT Download Server packges xff0c 找到自己的架构 xff0c 以 x86 64 为例 xff1a 在 etc o
  • ARM:系统移植2

    1 u boot启动程序 1 获取uboot源码渠道 1 xff09 u boot官方 xff1a https ftp denx de pub u boot 2 xff09 开发板厂家 3 xff09 芯片厂家 4 xff09 主管领导 x
  • ChatGPT 相关资料收集

    本文地址 xff1a blog lucien ink archives 538 本文用来收集各种和生成式模型相关的内容 xff0c 由于 ChatGPT 是其代表 xff0c 也是会被写入人类历史进程的一个名字 xff0c 所以便用 Cha