通用智能面临巨大掣肘,国产AIGC还在寻找光明

2023-11-10

410d2443c1174cc787e9b054c651db22.jpg

 

无论技术有多先进,符合商业规律才能笑到最后。

@数科星球 原创

作者丨苑晶  编辑丨十里香

AI­GC背后充满了故事,在一家家企业手握巨额融资之时,人们耳边再次响起了警钟。诚然,在新的浪潮之下,符合商业规律的企业才能笑到最后。在国外竞品大踏步前行之际,国内的通用智能企业境遇如何?

前景很乐观,但当下似乎并没那么好过。

01

来自Op­e­n­AI的压力

似乎Op­e­n­AI的进步更快。

“我觉得我们和Op­e­n­AI的差距越来越大了”,一位AI­GC从业者对数科星球(ID:di­g­i­t­al-pl­a­n­et)这样表述。前些日子,在Ch­a­t­G­PT推出后,不仅是英文对话,在中文领域,该系统的用户体验也超越了国内的众多产品。以至于,一时间,人们的朋友圈被Ch­a­t­G­PT的对话刷屏。

“最早,我测试过一些特殊的中文语境,Ch­a­t­G­PT表现不好,不过最近我在测试的时候发现它进步很快”,这位技术人员曾以诸如“关公战秦琼”等有中文历史背景的话术测试机器人,他发现,最近这款产品在中文适配方面有了明显进步。

赤裸裸的对照实验结果出现后,技术派的内心是焦虑且复杂的。一些国内企业对我们表示,以目前的进度来看,光是追上Op­e­n­AI,就感觉“很吃力”。

虽然,目前Op­e­n­AI的终端产品由于众所周知的问题未在国内市场全面铺开,但对于具有技术理想的相关企业来说,这种滋味是十分难受的。有人将这种情况描述为北斗未出现时的导航行业,“从信创的角度考虑,中国的AI­GC是肯定要有的,但技术差距也是不可忽视的”,一位投资人评价道。

客观来说,造成国内AI­GC落后于同行的原因是多方面的:有A100显卡的获得受到制约、国内人才队伍发展较慢等诸多原因。其中,在硬件方面,大模型训练过于依赖进口GPU显卡,虽行业间出现了便宜的国产替代品,但以目前的技术水平,还不能给出满意的性能支持;而在人才队伍方面,一些行业人士称“算法工程师多,但会大模型的凤毛麟角”。

全局来看,当下,似乎仅有百度公司、清北高校等团队立志于全身心投入于此。大模型所谈者甚多,但行业“孤勇者”数量寥寥。

02

国产AI­GC的进击障碍

摆在通用智能或大模型发展之路的另一个障碍是小模型。

我们在文章中所提到的“大模型”概念是一个术语。之所以称之为大模型,因其在训练数据过程中引入多模态等数据,让数据标注的数量大规模增加,使之展现可打破行业藩篱的普适性。相对于小模型而言,具有通用性好、边际成本低、效率高等特点。

后来,Op­e­n­AI再次点燃人们对通用智能的期待。在一些具有前瞻思维的技术派眼里,大模型对于各行各业的影响将是摧枯拉朽式的,他们一致认为大模型是“当之无愧”的未来发展方向。也就是说,技术上,大模型的发展上限更高,其会在未来某个时间点达到各种小模型的用户体验阈值。

由于大模型的横空出世,小模型统治AI的格局被打破。应该说,就本质而言,两种技术路线背后代表着不同的利益。以至于,互联网上,网友对两种技术路线的讨论十分热烈:一会有人指责大模型是“大炼钢铁”,一会又有人攻讦小模型是“亚当斯密小作坊”式的抱残守缺。

客观来说,小模型在当今的市场竞争中仍然具有重大影响:从业者们通过算法微调、反复训练数据等措施下,一些产品收到了不错的效果,对于客户而言,甚至在一些领域内的结果要好于大模型产品。

其次,国内通用智能的AI­GC缺少数据训练场景。

类似Ch­a­t­G­PT的训练场景尤为缺乏。在上文提到过的,这款产品之所以短时间之内进步神速,因大量用户为其充当了免费的数据标注员。不过,已目前情况来看,可与Ch­a­t­G­PT相较的数据训练场景在国内还鲜有见到。

另外,产业界对大模型有着浓烈的观望情绪。

在对谈多家相关企业后,数科星球(ID:di­g­i­t­al-pl­a­n­et)发现了产业界对AI­GC持观望态度的主要原因。概括来说,业界普遍存在这样的忧虑:目前大模型应用不成熟,骤而上马将会对原有业务造成冲击。

以电商售后和银行电话客服场景为例,目前行业内仍采用主流智能客服公司推出的QA问答库技术。客户企业希冀大模型产品能够解决QA库无法承担的长尾问题,覆盖到检索式问答路径无法涉足的领域,但金融行业的语料库等数据又不对外开放,让大模型企业不得不重头开始。

这都延迟了大模型进军具体行业的时间表。

目前,一些从业者透露,金融科技公司愿意为大模型企业提供“必要但不致命”的应用场景。在这些场景中,客户企业可以承受一定程度的容错,也愿意投入时间和资源支持大模型的进一步发展。“我们的主要客户来源于金融机构的创新部门,因为他们支持一些通用智能的事情”,一位销售人员对数科星球(ID:di­g­i­t­al-pl­a­n­et)这样说。

“死马当活马医,反正没办法解决长尾,不如让大模型试试”,这是金融行业业内给出的真实看法。甘愿“冒风险试一试”的场景有公文写作、情感理解等。

总结而言,通用智能企业需要客单价高、数据训练场景丰富的派单需求,但这个问题又与企业的现实考量和预算投入相互矛盾。

没得数据用来训练、没得大钱(投资除外)养活产品,是摆在现实的两大难题。

03

国内AI­GC的扩散难

元宇宙爆火,燃遍各行各业。它能否成为助力通用型AI­GC扩散的有力平台?

这是一个有趣的想象。答案是,可以,但很难。

目前,AI­GC和元宇宙的发展虽然存在相关性,不过就目前的情况来看,二者还未完全合流,处在“你做你的、我做我的”的阶段。

举例来说,在一些社群中,我们曾讨论这样的使用场景:在在线绘画App中嵌入AI­GC功能,使用户在提交绘画作品后自动生成AI­GC图片。面对这个问题,某些供应商对数科星球(ID:di­g­i­t­al-pl­a­n­et)分享:“实际上,在第三方App中嵌入AI­GC难度很大,要有能力处理高并发,要低延时,从而不影响用户体验”,在他的想法中,甲方的需求可以满足,但如若在实时在线的基础上,成本颇高。

退而求其次,供应商给出了离线生成或自建图库的方式满足需求(自建图库是预先在系统保存大量已经生成的图片,用户有需求时直接调用)。但很明显,这种折中的方式违背了AI­GC设计的初衷。时间长了,对于训练大模型更是无从谈起。

在同样爆火的数字人中,AI­GC的应用场景也不算多。目前,市面上绝大多数数字人均属“服务型数字人”。它们被广泛应用在虚拟的办事大厅、博物馆、手语电视台的手语节目等场景之中。

剖开数字人产业链可以看得更加直观:在这个产业链中,底层为算法层,负责驱动面部表情和手势动作;中层为渲染层;上层为构成层,负责建立数字人图像。但除了底层“数字脑”领域,其他层面与通用智能结合较少。

在某知名投资机构投资人看来,“未来的数字人会相当多”,他认为,人们会拥有具有服务和陪伴属性的虚拟分身。但在技术上,想让人工智能具备情感陪伴功能还尚需时日,“至少目前技术是达不到的”,一位技术人员补充说。

整体来看,目前的数字人大多承担着IP形象功能,能说话的数字人还比较少。在一些先进的数字人中,“中之人”又是必不可缺的因素(其承担动作捕捉、虚拟拍摄、表情抓取和后期合成、渲染精修等工作的真人)。表面上,这种数字人比较高端,但其背后通常有大量人员为其服务,制作成本虽有所降低,但整体制作成本也并不低廉。

以上原因都阻止了AI­GC或通用智能扩散至寻常百姓家。

结尾:企业显然不会坐以待毙。他们给出的策略大体分为三块:对外投资以扩充数据训练场景、夯实客户关系以获取现金流、堆人堆设备砸钱砸出大模型。

以上基本盘是投资机构给出的巨额投资。

“这好比把高科技做成了劳动密集型企业”,一个业内人士哂笑。不过,在当下的时间点,这是没办法的办法。技术上,只要机器足够、标注正确,哪怕是“堆”,也可达到预期目的。

钱的方面,高科技企业已下定决心“内卷”数字经济同行,有销售人员将其称之为“关系是第一生产力”。不过这种思路面临一个问题,就是大模型和通用智能的认知度要高。

“我们拜访了很多客户,但很多人其实根本不理解大模型”,一位业内人士对数科星球(ID:di­g­i­t­al-pl­a­n­et)表述。在他的眼里,传统数字经济在新技术面前有巨大的提升空间。

举例来说,比如政务大屏。

“之前为调取一个地方数据,大屏只能靠下拉、下拉、再下拉的方式调用,而现在对语音助手说‘我要今年的生产情况’,就能自动生成”,这位业内人士解答,在他眼里,东西是好东西,但在买家面前变成了另外一个景色:“如果一个领导想做,他只需要1个理由去做,如果他不想做,他会找出100个理由不做”。

AI­GC热潮高企,但一线销售人员往往会频频碰灰。在高科技浪潮风起云涌的当下,很多人承担着不能言说的苦衷。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

通用智能面临巨大掣肘,国产AIGC还在寻找光明 的相关文章

随机推荐

  • OLED屏幕实时显示超声波测距数值(Arduino学习笔记1)

    废话不多说 直接介绍该项目 1 元器件和设备 Arduino UNO板 X1 HC SR04超声波测距模块 X1 OLED显示屏模块 X1 杜邦线公对公 X8 面包板 X1 2 接线到对应引脚 本人没有什么艺术造诣 天外飞线才是我的准则 3
  • Docker常用命令总结

    目录 目录 一 帮助启动类命令 1 启动docker 2 停止docker 3 重启docker 4 查看docker 5 设置开机自启 6 查看docker概要信息 7 查看docker总体帮助文档 8 查看docker命令帮助文档 二
  • angular 常用的内置的管道

    1 CurrencyPipe 货币管道 将数字转换为货币字符串 根据确定组大小和分隔符 小数点字符以及其他特定于区域设置的配置的区域设置规则进行格式化 value expression currency currencyCode displ
  • 【Pytorch Lighting】第 2 章:第一个深度学习模型起步

    大家好 我是Sonhhxg 柒 希望你看完之后 能对你有所帮助 不足请指正 共同学习交流 个人主页 Sonhhxg 柒的博客 CSDN博客 欢迎各位 点赞 收藏 留言 系列专栏 机器学习 ML 自然语言处理 NLP 深度学习 DL fore
  • 华为OD机试真题-流水线-2023年OD统一考试(B卷)

    华为OD机试2023年最新题库 JAVA Python C 题目描述 一个工厂有m条流水线 来并行完成n个独立的作业 该工厂设置了一个调度系统 在安排作业时 总是优先执行处理时间最短的作业 现给定流水线个数m 需要完成的作业数n 每个作业的
  • el-select + el-tree

    1 效果图 2 组件
  • 微信公众号小说系统源码 漫画系统源码 可对接微信公众号 APP打包 对接个人微信

    源码描述 修复版掌上阅读小说源码 公众号漫画源码可以打包漫画app 产品介绍 掌上阅读小说源码支持公众号 代理分站支付功能完善强大的小说源码 公众号乙帅读者 可以对接微信公众号 APP打包 支持对接个人微信收款 产品优势 1新增签到 平台分
  • 【语义分割】1、语义分割超详细介绍

    文章目录 一 分割方法介绍 1 1 Fully Convolutional Networks 2015 1 1 1 FCN 1 1 2 ParseNet 1 2 Encoder Decoder Based Models 1 2 1 通用分割
  • < 在Vue中 el-popover + el-tiptap 实现 富文本框输入,表格点击展示 (富文本HTML标签渲染) >

    文章目录 前言 一 原理 gt el tiptap 安装 及 使用案例 二 实现案例 gt 富文本输入端 gt 富文本输出端 展示端 三 效果演示 小温有话说 往期内容 前言 在Vue开发中 有时候需要用到富文本框输入指定的 富文本 输出端
  • linux搭建虚拟化平台报告,Centos部署KVM虚拟化平台(可跟做)

    Centos部署KVM虚拟化平台 可跟做 发布时间 2020 08 19 05 47 46 来源 51CTO 阅读 4210 作者 俊伟祺i 一 KVM概述 KVM是Kernel Virtual Machine的简写 目前Linux发行版必
  • 电子版简历有哪些(合集)

    word Excel PPT简历 传统的电子版简历 即用文档软件编辑的简历 这一类简历的呈现模式只有单一的文字 图片或表格 传统 意味着被广泛求职者所使用 优点包括有 传统 端庄 直观 但传统也意味着没有创新 缺点包括有 乏味 不新颖 没有
  • BeyondCompare 破解(试用期重置)

    将安装日期改为未来的日期 beyond compare 安装后会在 C Users 计算机名 AppData Roaming BCompare 目录下生成一个 ini文件 记录 安装的时间 和 最近一次打开软件的时间 只要超过30天就会提示
  • X64处理器架构

    X64处理器架构 翻译的windbg帮助文档 X64处理器架构 X64 架构是一个向后兼容的扩展的 x86 提供了和 x86 相同的 32 位模式和一个新的 64 位模式 术语 x64 包括 AMD 64 和 Intel64 他们的指令集基
  • Spring在代码中获取bean的几种方式

    Spring在代码中获取bean的几种方式 方法一 在初始化时保存ApplicationContext对象 方法二 通过Spring提供的utils类获取ApplicationContext对象 方法三 继承自抽象类ApplicationO
  • 黑客一般是如何入侵电脑的?

    1 无论什么站 无论什么语言 我要渗透 第一件事就是扫目录 最好一下扫出个上传点 直接上传 shell 诸位不要笑 有时候你花很久搞一个站 最后发现有个现成的上传点 而且很容易猜到 不过这种情况发生在 asp 居多 2 asp aspx M
  • CV计算机视觉核心07-目标检测yolo v2、v3(yolo初始版本的v0和v1版本代码)

    CV计算机视觉核心07 目标检测 设计检测类算法的output层 可用已知条件有 1 检测问题的输出是什么 怎么用数字来表示 输入是一个矩阵 输出是 x y w h 其中x和y表示目标的左上角坐标 w和h表示目标的长和宽 因此输出是用四个这
  • 【NLP】维基百科中文数据训练word2vec词向量模型——基于gensim库

    前言 本篇主要是基于gensim 库中的 Word2Vec 模型 使用维基百科中文数据训练word2vec 词向量模型 大体步骤如下 数据预处理 模型的训练 模型的测试 准备条件 Windows10 64位 Python3 6 并安装 ge
  • ‘git‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。

    1 cmd报错内容 C Users 27104 Desktop gt git clone https github com tianyucoder 200826 ajax git 不是内部或外部命令 也不是可运行的程序 或批处理文件 2 原
  • range()函数

    range 函数 创建一个整数列表 一般用于for循环当中 1 语法 range start stop step start 计数从start开始 默认为0 range 9 和range 0 9 是一样的 stop 计数到stop为止 但不
  • 通用智能面临巨大掣肘,国产AIGC还在寻找光明

    无论技术有多先进 符合商业规律才能笑到最后 数科星球 原创 作者丨苑晶 编辑丨十里香 AI GC背后充满了故事 在一家家企业手握巨额融资之时 人们耳边再次响起了警钟 诚然 在新的浪潮之下 符合商业规律的企业才能笑到最后 在国外竞品大踏步前行