带你进入 OpenAI 的世界

2023-11-11

2021年11月的 Microsoft Ignite , 微软带来了全新的 Azure OpenAI Service,通过新的 Azure 认知服务能够访问 OpenAI 强大的 GPT-3 模型 。 虽然微软还没有正式开放 Open AI Service , 但 GitHub 和 OpenAI 已经推出了基于 GPT-3 的新模型 Codex 的工具 - Copilot ,通过它可以帮助软件开发人员更高效地编写代码。我相信不少小伙伴都已经开始在 Visual Studio Code / Visual Studio 使用 Copilot 感受到 GPT-3 的威力。 作为开发者, 希望微软能尽快开放相关文档, 能尽快掌握相关技能 。 为了满足各位要求, 今天我就带大家进入 OpenAI 。
 

GPT-3 介绍


2020 年 5 月,Open AI 发表了一篇开创性的论文,题为 Language Models Are Few-Shot Learners。 他们展示了 GPT-3语言模型,它使用了一个具有 1750 亿个参数的神经网络。 GPT-3 使用来自 CommonCrawl、WebText、维基百科和书籍语料库的数据进行训练, 并在各种自然语言处理任务中表现出惊人的性能,包括翻译、问答和完形填空任务。在性能上 GPT-3 也是非常优秀, 超过了很多现有的模型。2020 年 7 月,也就是论文发表两个月后,OpenAI 开放了一个 beta API playground,大家可以通过 API 方式访问 GPT-3 模型。

GPT-3 的几个主要特点

1. 零/单/少样本学习(Zero/one/few-shot learning): 通常,深度学习会针对一组特定的类别进行训练和测试。 如果计算机视觉中对星球大战中的 BB8 , R2D2 , C3PO 进行分类,在测试过程中就只能针对这三个类别进行。 但在零样本学习设置中,系统在测试时,可以使用不在训练内的类别(例如,用曼努达人做测试)。 单/少样本学习(one-shot 和few-shot) 也是一个道理,在测试时,系统会分别看到一个或几个新的类别。

2. 零/单/少样本任务迁移(Zero/one/few-shot task transfer): 这个整合了 零/单/少样本学习和多任务学习的概念。 新任务(或者显示零个、一个或几个新任务的示例)可以随时执行,而不是在测试时才展示新类。 例如, 输入 “I love you -> 我爱你。 I miss you -> ____。” GPT-3 就可以通过单样本任务迁移 ,把之前没有训练过的英语转中文的任务执行起来

3. Transformers: Transformers 是解决机器翻译问题的框架, 有一个简单的网络结构,基于自注意机制,不依赖于递归和卷积完全。通过并行计算使Transformer效率高,需要更少的训练时间。

4. 生成模型(Generative models): 统计学中分类任务有两种模型-判别模型,生成模型。 判别模型对给定的可观察变量和目标变量对的条件概率进行编码:p(y|x)。 生成模型对联合概率进行编码:p(x,y)。 生成模型可以“生成类似于现有数据的新数据”,GPT-3 模型就是应用生成模型来。

5. 多任务学习(Multitask learning): 大多数深度学习系统都是单任务的, 只针对特定的场景。多任务系统克服了这一限制。 他们受过训练,能够针对给定的输入解决不同的任务。 例如我输入一个苹果,他可以帮我翻译成英文的 Apple ,可以找到一张苹果的图片,也可以找到苹果的一些特征等。

6. 半监督学习(Semi-supervised learning): 是以无监督的方式训练具有非常大数据集的模型,然后通过在较小的数据集中使用监督训练来调整模型以适应不同的任务。
 

通过 OpenAI API 调用GPT-3

由于微软现在还没开放 OpenAI 的 GPT-3 功能 , 现阶段我们只能通过 OpenAI (beta.openai.com) 提供的 API 使用 GPT-3 。(当然你需要有一个美国的电话号码来激活该功能) ,OpenAI 有非常丰富的文档, 以及示例 ,让开发者可以非常快上手使用 API。

Python 调用 API 几个必须的步骤

  1. 安装 openai 库
     
    pip3 install openai

     2. 申请 API 的密钥

     3. 可以通过 Notebook 测试一下

 

几个注意的点

  1. 模型 engine ,现在针对 GPT-3 有2个比较主要的模型
模型 介绍
text-davinci-002 GPT-3 关于自然语言处理场景的模型,通常需要较少的上下文。 除了响应提示外,还支持在文本中插入补全。
code-davinci-002 可以理解和生成程序代码的模型,包括将自然语言翻译成代码(这个模型需要另外申请)

    2. 关于一些示例,你可以通过访问 OpenAI API 学习更多的应用场景

     3. 你可以通过 OpenAI 提供的 Playground 做一些测试 OpenAI API

     4. 你可以针对自己的业务定义 GPT-3 模型 ,你可以通过该链接了解更多 Customizing GPT-3 for Your Application

展望


GPT-3 功能强大 ,让 AI 应用场景更贴近实际的生活 。 我非常希望微软的 OpenAI Service 能尽快开放 ,让更多的开发者能使用。 还有现在 OpenAI GPT-3 在中文的支持还是非常有限的, 我也寄望微软版本的服务能有更好的中文支持。
 

相关资料

  1. 了解 Azure OpenAI Service 功能,请访问 OpenAI Service – Advanced Language Models | Microsoft Azure

  2. Azure OpenAI Service 介绍,请访问 New Azure OpenAI Service combines access to powerful GPT-3 language models with Azure’s enterprise capabilities - The AI Blog

  3. OpenAI 的相关博客 OpenAI Blog

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

带你进入 OpenAI 的世界 的相关文章

  • babel6.X、babel7.x、 babel8.x用法

    babel6 x使用方法 需要安装的包 npm install babel loader save npm install babel core save npm install babel preset es2015 save npm i
  • Jmeter2-手机验证码方式进行用户登录

    使用手机验证码实现登录 调用了两个接口 一是发送短信验证码 二是用户登录 思路 1 使用CSV Data Set Config参数化 2 获取时间戳 3 发送短信验证码 4 使用BeanShell取样器从redis缓存中获取短信验证码 5
  • Grafana与python后端通过get请求进行通信

    插件配置请参考 Grafana获取URL地址中的json数据 Grafana下载如下插件 文章目录 模拟URL路由 配置Grafana插件 效果展示 模拟URL路由 from fastapi import FastAPI Query imp
  • postman请求一个url,could not get any response

    postman请求一个url不通 浏览器可以访问通 preface 现象 排除问题 总结 preface 最近 同事使用 postman 遇到一个问题 url 请求不通 could not get any response 现象 排除问题
  • 使用 Iceberg on Kubernetes 打造新一代云原生数据湖

    背景 大数据发展至今 按照 Google 2003年发布的 The Google File System 第一篇论文算起 已走过17个年头 可惜的是 Google 当时并没有开源其技术 仅仅 是发表了三篇技术论文 所以回头看 只能算是揭开了

随机推荐

  • STM32速成笔记—ADC

    文章目录 一 什么是ADC 二 ADC的用途 三 STM32F103ZET6的ADC 3 1 ADC通道对应引脚 3 2ADC时钟 3 3 ADC工作模式 3 4 ADC转换时间 3 5 ADC校准 3 6 ADC转换结果与实际电压的换算
  • js中的对象和函数的彻底理解

    在js中对象就是神一般的存在 什么都是对象 包括函数 你就这么理解好了 函数是用来实现具体功能的代码 用一种方式把他们组织起来 就是函数了 对象是有属性和方法的一个东西 在对象中的函数就变成了方法 刚学习js不用太纠结这些概念性的东西吧 慢
  • Python学习第十六天——数据库基础与MySQL基础操作

    数据库分类 1 关系型数据库 有固定的表结构 并且表与表之间可以建立关系 常见数据库 MySQL PostgreSQL Oracle db2 sqlite sqlserver access mariadb 2 非关系型数据库 没有固定的表结
  • EMWIN密码验证窗口创建

    EMWIN密码验证窗口创建 调用接口 file PasswdCheck c date 2020 7 6 author aron566 copyright None brief 通用密码验证页面 details None version V1
  • 买不到的数目 遍历法和公式推导法(第四届蓝桥杯省赛C++A组,第四届蓝桥杯省赛JAVAC组)

    突然决定要参加蓝桥 已经超级久没复习C C 的我考前还是决定打几道题捡一捡C C 的语法和思路 2023年蓝桥的题之后会出 因为 AcWing上还没有出可以测试的程序 也没把握说自己考场上做的就是对的 目录 题目 思路 代码 题目 小明开了
  • 华为od机试题5 真题

    华为od机试题 真题 45 满足规则的数组组合 44 最长连续子序列的和等于输入值 43 整数编码 42 输出指定格式字符 40 小朋友分班 39 数列解析 38 url拼接 36 满足最低能力值的数量 以下题目附带Java解法 是我个人写
  • shell中的求幂

    小白今天突然想用shell来求一下2的32次幂 一时竟想不出求解办法 上网搜了一下 操作之后 发现很简单 如下 oracle linux101 gt echo 2 32 bc l 由此可得 bc并不支持幂的求法 standard in 1
  • JVM概述

    1 什么是JVM JVM是Java Virtual Machine Java虚拟机 的缩写 JVM是一种用于计算设备的规范 它是一个虚构出来的计算机 是通过在实际的计算机上仿真模拟各种计算机功能来实现的 引入Java语言虚拟机后 Java语
  • Vue项目打包后,修改请求后端的地址

    目录结构 其中public文件夹中的东西会原封不动的打包 因此在里面新建一个webConfig json baseURL http 6060 socketURL timeout 10000 在main js中设置 import axios
  • git 小乌龟 配置_小乌龟(TortoiseGit)基本使用详解

    1 环境安装 Git最新版下载地址 https gitforwindows org TortoiseGit Git客户端 32 64位最新版及对应的语言包下载地址 https tortoisegit org download 安装的方法 一
  • GitHub copilot用不了,有什么好的替代?

    如果你无法使用GitHub Copilot 以下是一些替代方案 Visual Studio IntelliSense 如果你使用Visual Studio Code作为开发环境 可以安装IntelliSense插件 它提供了类似的智能代码补
  • ChatGPT在GIS领域应用初测

    1 引言 ChatGPT是由OpenAI开发的一种大型语言模型 它使用了Transformer架构 在大量现实世界文本数据上训练 以捕捉人类语言的复杂性和多样性 能够实现许多人工智能语言处理任务 如回答问题 进行翻译 修改代码 生成文档 文
  • Cisco UC 项目常见问题及解决方法

    第一大类 Callmanager 1 OS product key BTOO VQES CCJU IEBI 2 增加subscriber 服务器 1 在publisher上增加一个server 2 在subscriber上手动启动需要的服务
  • typescript基础之never

    TypeScript 的 never 类型是一种特殊的类型 它表示的是那些永远不存在的值的类型 例如 一个抛出异常或无限循环的函数的返回值类型就是 never 因为它们永远不会返回任何值 never 类型是所有类型的子类型 也就是说 任何类
  • idea Cannot find declaration to go to问题的解决,ctrl+左键无法进入代码/如何导入源码包

    1 idea Cannot find declaration to go to问题的解决 ctrl 左键无法进入代码 解决方案1 file gt project structure gt 设置main下java文件夹为source 选中sr
  • 期货手续费怎么计算?

    期货手续费怎么计算 另一种按照成交金额的比例 收取费用 一般是万分之几 对应计算公式为 N手某期货合约手续费 开仓 平仓成交价 交易单位 手续费率 N手 比如 螺纹钢的手续费是成交金额的万分之一 且螺纹钢的价格是元 那么投资者购买一手螺纹钢
  • 安装sitemap插件时遇到found 4 low severity vulnerabilities

    small debug 安装sitemap插件时遇到found 4 low severity vulnerabilities 正在安装sitemap插件 npm install hexo generator sitemap save 适合提
  • CSS_calc() 函数内部怎么使用scss变量

    使用 calc 函数来计算主体元素的宽度 其中通过 语法将 SCSS 变量转换为 CSS 变量 然后使用加法运算符 和乘法运算符 来计算宽度值 main width 100px main padding 10px main width ca
  • Unity 打包exe时添加管理员权限

    第一步 打开WindowsPlayer sln 路径 Editor Data PlaybackEngines windowsstandalonesupport Source WindowsPlayer 第二步 修改level level改成
  • 带你进入 OpenAI 的世界

    2021年11月的 Microsoft Ignite 微软带来了全新的 Azure OpenAI Service 通过新的 Azure 认知服务能够访问 OpenAI 强大的 GPT 3 模型 虽然微软还没有正式开放 Open AI Ser