可能是最有前途的国产大模型:讯飞星火认知大模型

2023-11-09

大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。

昨天下午,科大讯飞发布了自己的大模型——星火认知大模型。在上周他们还在内测的时候,我就第一时间拿到了内测资格,通知群里的小伙伴,申请也是秒过。我简单地测试了一下,最直观感受就是「水平在线、诚意满满」。

昨天我观看了他们的发布会。关于大模型,刘庆峰主要讲了1+N的模式,1就主要是大模型的七个能力:内容创作、语义理解、知识问答、逻辑推荐、数学能力、代码能力,还有一个多模态。

loading

对于这些能力,各家的说法都不一样,无外乎就是吴恩达总结LLM的几点能力:总结、推断、转换、扩展。性能上,大语言模型的一些问题它也存在。总的来说,还算中文大模型中第一梯队。那它为什么是「可能最有前途」的那个呢?我主要有以下几点思考

与语音的结合,有天然的优势

我们知道,科大讯飞是一家做语音起家的公司。在许多场景中,前端声学处理 + 语音识别 + NLP + TTS构成了一个最基础的语音全链路技术 。科大讯飞这几十年就是在这个生意,不管是2B业务,还是2C业务。

在全链路的NLP部分,这些年使用最多还是神经网络。而以ChatGPT为代表的大语言模型,使用的是Transformer,算是一种神经网络的技术升级。讯飞的大语言模型的引用,就会对NLP作出了较大的改良。当然其实模块也有会影响,但NLP提升性能最大。

loading

我们在发布会现场也看到,科大讯飞研究院院长刘聪演示大模型案例的时候,输入是使用语音输入,再识别成文本(ASR)。回答的文本也使用了语音合成(TTS)技术读文本。可以看到,他们整合很迅速了。这些前、后端,都是他们成熟的技术,这就是他们比其他公司的优势。

与现有业务结合,快速落地商用

一个新的技术,能否迅速流行起来,就是看能不能快速融入到现有的商业模式中去。在国产大模型中,阿里的通义千问,有这样的潜质。与钉钉办公产品结合,有着立竿见影式的降本增效功能,但钉钉的商业化之路一直走得不顺。

讯飞业务中,教育占了很大比重。其实在发布会,后面也显示了「智能批改作业」的功能,这就是一个很直观的商业落地场景。这块业务,他们在市场、渠道、产品、商业模式都走通过。现在只要用大模型的能力,把这些节点都重塑、改造。小步探索,慢慢试水,就容易搞出一条大模型的变现之路。有了商业的正反馈,技术发展也会得到保障,形成商业与研发的良性互动。

loading

一些新的点

除此之外,我还看到他们关于插件、RPA的一些演示。其实这些是针对大语言模型的技术尝试。我在之前的文章《》,就介绍了OpenAI的Gerg在TED演示的一些内测功能,就有插件的应用。比如6月份,他们还会集成浏览器插件,实现实时信息搜索,可以说讯飞应用层面,没有落后太多。

loading

挑战与风险

我注意到,在昨天的发布会上,刘庆峰在介绍大模型的能力之前,就先提出一个「评测体系」的概念。一方面是想当国内大模型的执牛耳者,成为标准的制定者。还有一个考量就是边界划定。这波AI热度无疑是里程碑式的,那它目的地在哪里?安全边界又怎么界定?

这其实是当下各国政府以及科学家最担心的问题,还不说远景的AGI发展与人类的关系的思考,就当下如何保证技术不被滥用,都是一个很大的课题。讯飞想接这个瓷器活,但也不一定拿得出「金刚钻」

loading

还有一个挑战,就是「算力」。我们大模型的训练和使用就是算力猛兽,每一次请求,都是数亿次的计算。据CNBC报道,ChatGPT一次训练需要200-1200美元,用了1万个英伟达的DGX A100 GPU服务器。这些高性能的GPU,就是机器学习和图形计算的AI心脏,而英伟达占据了95%有市场,之前传闻A100和H100 GPU都不卖给中国公司了。科大在22年9月被美国列入了「实体清单」,要获得这些高性能GPU更是难上加难。

巧妇难为无米之炊,谁不能忽视悬在中国公司头上的「达摩克利斯之剑」

再有一个就是对于「智能涌现」分歧,对于大语言模型的发展,实践其实是走在理论在前面。相关研究人员发现,在ChatGPT的训练语料中,中文不到1%,但是在实际的使用过程中,中文的能力并不会比英文低很多。是不是模型在海量语料学习中,掌握各种语言之间的通用规则,出现一种「智能涌现」的能力?这其实还没有定论。1750亿的参数,就是一个黑盒子。

在刘庆峰的发言稿中,我搜索了「智能/智慧涌现」高达14次。可以看得出他对这个能力的信息,这到底是科学地乐观主义,还是盲目冒进,抑或其他原因,不得而知。

loading

后话

在知乎上,有一个网友问讯飞大模型,Who is the President of the United States?「美国的总统是谁」,大模型回答,他的知识更新是2021年9月,后面的事情它不知道。

2021年9月是一个代表性的日期,ChatGPT和GPT-4他们的训练集知识断点也是这个时间。所以也有网友怀疑,它只是调用OpenAI的API。我自己试了下,怎么回答不会再出现那个「2021年9月」了。当然,这也说明不了什么。

loading

讯飞在发布上的所有示例,都是真人现场演示,我还是觉得他们是有底气的。对此,我保持谨慎而乐观!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

可能是最有前途的国产大模型:讯飞星火认知大模型 的相关文章

随机推荐

  • Vue + axios + vant 封装公共请求

    import axios from axios 引入axios import router from router 引入路由 import Toast from vant 引入提示层 export function post obj 调用时
  • 线程的声明周期

    要想实现多线程 必须在主线程中创建新的线程对象 JAVA中使用Thread类及其子类的对象来表示线程 在它的完整的生命周期一般要包括5类 新建 当一个Thread类或子类的对象被声明并创建时 新生的线程对象就处于新建状态 就绪 处于新建状态
  • Matlab读取csv文件csvread函数的使用

    方法一 M csvread FILENAME 读取逗号分隔值格式的文件名 结果直接返回给M 因此 文件只能包含数值 方法二 M csvread FILENAME R C 从逗号分隔值格式的文件中读取数据 从R行和C列开始 R和C从零开始 因
  • PHP cURL获取HTTP响应头

    前言 平时做开发时 经常会用到PHP的cURL扩展 用于请求外部HTTP接口 大多数情况下 我们只需要获取接口返回的响应体 HTTP response body 但如果我们想获取响应头 HTTP response header 那可以怎么做
  • Mac-解决程序包javafx.util不存在

    环境 macos m1芯片 IDEA jdk zulu 8 jdk 1 8 0 322 支持m1芯片的 解决方式 1 更换jdk版本 不使用支持m1芯片的jdk 到官网 链接下载macos的jdk1 8 0 333 且下载成功之后不需要配置
  • Eclipse调整XML源代码文件字体大小

    Eclipse调整XML源代码文件字体大小 Window gt Preferences gt General gt Appearance gt Colors and Fonts gt Basic gt Text Font 点击Edit 设置
  • 简单的书签服务LinkDing

    今天是上海全域静态管理的第 29 天 周三抗原 周四老苏刚做完核酸 居委突然通知后面的不做了 大家一阵慌乱 结果后来又通知继续 这是要闹哪样 据说是怕系统崩溃 周五终于休息了 根据居委会的通告 周二的核酸又发现一管异常 希望昨天的复检正常吧
  • Codeforces Round#808 div.1+div.2题解

    视频讲解 BV1ya411S7KF div 2 A Difference Operations 题目大意 给定长度为 n n n 的数组 a a a 可以进行任意次操作 每次操作选择一个整数
  • Android高德地图获取当前缩放等级及可视区域四个角的坐标

    获取当前缩放等级 未开启定位图层 在fragment中oncreatview生命周期中无法获取到 可以在Onresume中获取 float zoom mAMap getCameraPosition zoom VisibleRegion vi
  • 第5章域内横向移动分析及防御

    域内横向移动投不定在夏杂的内网攻击中被广泛使用的一种技术 尤其是在高级持续威胁 Advanced Persistent Threats APT中 攻击者会利用该技术 以被攻陷的系统为跳板 访问其他域内主机 扩大资产范围 包括跳板机器中的文档
  • 三千预算进卡吧的顺口溜是啥

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 三千预算进卡吧 加钱加到十万八 十核 E7装上去 四路泰坦抱回家 4K 屏幕组三屏 万元液态温度压 固态硬盘装三块 硬盘内存使劲加 键鼠必花几千元 耳机手柄八千八 还有机箱
  • Java异常————argument type mismatch

    今天写程序遇到的错误 Exception in thread main java lang IllegalArgumentException argument type mismatch argument type mismatch 参数类
  • 简单几步:实现Redis的访问

    一 导入jar包 这里有两个 jedis 2 9 0 jar commons pool2 2 4 2 jar 二 写一个工具类 我叫做 RedisTools类 代码如下 import redis clients jedis JedisPoo
  • 史上最全的Selenium三大等待介绍

    一 强制等待 1 设置完等待后不管有没有找到元素 都会执行等待 等待结束后才会执行下一步 2 实例 driver webdriver Chrome driver get https www baidu com time sleep 3 设置
  • HAL库的使用之Cube配置编码器输入捕获模式

    做平衡小车目前有两种思路 第一种是使用编码器电机 这样一般是两个闭环控制 直立闭环和速度闭环 另一种是使用步进电机 一般使用步进电机很少进行闭环控制 使用Cube进行配置时 发现几点注意事项 STM32单片机自带编码器接口 可以直接进行使用
  • python爬虫二——数据解析

    1 正则 爬取图片 import requests import re import os headers User Agent Mozilla 5 0 Windows NT 10 0 Win64 x64 rv 87 0 Gecko 201
  • GDB定制命令

    GDB定制命令 http www yolinux com TUTORIALS src dbinit stl views 1 03 txt
  • 计算机考试电子邮件怎么回复,计算机基础知识电子邮件使用技巧集锦(二)

    计算机基础知识电子邮件使用技巧集锦 二 分类 计算机等级 更新时间 2013 01 07 来源 转载 11 用ISP邮箱提高发信速度 现在免费电子邮件大都支持SMTP和POP3协议 故在设置服务帐号时 工具 选项 邮件服务器 中的 发送邮件
  • 无法加载文件 D:\node.js\node_global\vue.ps1,因为在此系统中禁止执行脚本。有关详细信息,请参阅 “get-help about_signing“。因为在此系统中禁止执行脚

    vue脚手架新建项目报错 PS C Users Administrator Desktop test gt vue init webpack test 无法加载文件 D node js node global vue ps1 因为在此系统中
  • 可能是最有前途的国产大模型:讯飞星火认知大模型

    大家好 我是可夫小子 关注AIGC 读书和自媒体 解锁更多ChatGPT AI绘画玩法 加 keeepdance 备注 chatgpt 拉你进群 昨天下午 科大讯飞发布了自己的大模型 星火认知大模型 在上周他们还在内测的时候 我就第一时间拿