Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Proximal Policy Optimization(PPO)和文本生成
ChatGPT的RLHF步使用了强化学习PPO算法 PPO是一种策略梯度方法 其交替地进行与环境交互采样数据和使用随机梯度上升优化 代理 目标函数 标准策略梯度方法对每个数据样本执行一次梯度更新 而PPO可以采样一批数据后 对模型进行多次梯
深度学习
强化学习
文本生成
ChatGPT追祖寻宗:GPT-2论文要点解读
论文地址 Language Models are Unsupervised Multitask Learners 上篇 GPT 1论文要点解读 在上篇 GPT 1论文要点解读中我们介绍了GPT1论文中的相关要点内容 其实自GPT模型诞生以来
论文解读系列
gpt
ChatGPT
文本生成
NLP
(2022 COLING)Context-Tuning情景化提示
论文题目 Title Context Tuning Learning Contextualized Prompts for Natural Language Generation 研究问题 Question 自然语言生成 生成长文本 研究动
文本生成
BART论文要点解读:看这篇就够了
全称 Denoising Sequence to Sequence Pre training for Natural Language Generation Translation and Comprehension BART来源于Bidi
论文解读系列
人工智能
自然语言处理
文本生成
bart
基于pytorch的LSTM进行字符级文本生成实战
基于pytorch的LSTM进行字符级文本生成实战 文章目录 基于pytorch的LSTM进行字符级文本生成实战 前言 一 数据集 二 代码实现 1 导入库及LSTM模型构建 2 数据预处理函数 3 训练函数 4 预测函数 5 文本生成函数
Pytorch
机器学习
LSTM
深度学习
文本生成
GPT4发布,有哪些升级和应用?
引言 GPT 4是OpenAI GPT系列研究最新里程碑 GPT 4接受图像和文本输入 是一个大型多模态模型 接受图像和文本输入 输出为文本 本文结合OpenAI官方Blog 技术报告微软Copilot发布会内容 详细介绍GPT4的接入方式
文本生成
Microsoft
ChatGPT
深度学习实战29-AIGC项目:利用GPT-2(CPU环境)进行文本续写与生成歌词任务
大家好 我是微学AI 今天给大家介绍一下深度学习实战29 AIGC项目 利用GPT 2 CPU环境 进行文本续写与生成歌词任务 在大家没有GPU算力的情况 大模型可能玩不动 推理速度慢 那么我们怎么才能跑去生成式的模型呢 我们可以试一下GP
深度学习实战(进阶)
深度学习
AIGC
gpt
文本生成