又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道

2023-10-27

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

AIGC(AI生成内容),这个概念在今年可以说是火得一塌糊涂。

例如Stable Diffusion,只要对它说一句话,“唰唰唰”地就能秒生成画作。

再如最近大火的ChatGPT,对答如流堪比人类,简直让网友们玩得不亦乐乎。

cf3bc8ccf6c6a4527a42227a726f8659.png
左:Stable Diffusion作画;右:ChatGPT作答

而就在这两天,AIGC赛道可谓是又双叒叕热闹了一把。

因为国内一家互联网出海巨头公司宣布——正式入局AIGC。

而且不同于其它玩家的单一路线,它在进军之际,直接是覆盖四大细分领域:AI图像、AI音乐、AI文本和AI编程。

例如在AI图像这件事上,只需要在微信小程序里输入一句话便可秒生成一副作品,而且是中英混着来也hold得住的那种:

一只猫咪eating noodle。

c2e3e784c6beab4930936c1f83d60e39.png

讲真,不仅是在形象方面做到了逼真,就连小猫咪自带的那种小心谨慎且不失可爱的劲儿也刻画了出来。

不仅如此,它还能生成其他多种风格的图片:

ed59d9623be9b1d58aa0fcd29b935b88.jpeg

61c85355c01ddb208c88ece62b86fdd1.jpeg

f25e92c5339f8577e01e6608263b9e61.jpeg

21a1780cfc3176e8589f9209277bc765.jpeg

(昆仑天工-天工巧绘 SkyPaint作品,向左滑动查看更多)

AI作曲就更不在话下了,直接上作品欣赏:

AI文本能力上,给出了一个上联,它便可以秒懂其意给出一个对仗的下联:

9f37ac88872addce9a0997be1a6c405b.png

不仅如此,聊天、问答、中英互译、内容续写等能力也是不在话下。

再如AI编程,在VS Code上只需简单安装一个插件,光标处按一下“Tab”键,一整段代码便可立即呈上:

8693d31142cea5851574c5fb0f91fc35.png

“互联网出海巨头”加持、一口气又发布并开源几大模型,这可以说是今年AIGC赛道值得关注的一件大事了。

这个玩家是谁?

不绕弯子,搞出如此大动作的玩家,正是昆仑万维

至于为什么说“值得关注”,可以总结为两点。

第一,就是有技术积累。

昆仑万维实则早在2年前便已经组建了超过200人的团队着手布局AIGC,此次推出的 “昆仑天工”旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,已覆盖图像、音乐、文本、编程等多模态内容生成能力。

除此之外,熟悉昆仑万维的朋友都知道,它在2008年成立之初,其业务是以网页游戏为主,包括自研的《三国风云》、《武侠风云》、《千军破》等等。

而后昆仑万维选择了一条进军海外的道路,除了自研之外,还代理运营了《极品飞车:最高通辑2015》、《愤怒的小鸟2》、《皇室战争》等众多风靡全球的游戏。

但说到它的逐步壮大,还要归功于业务和战略的转型,也就是从单一的游戏平台向互联网出海企业升级。

2016年至今,昆仑万维的业务已经形成了海外信息分发及元宇宙平台Opera、海外社交娱乐平台StarX、全球移动游戏平台Ark Games、休闲娱乐平台闲徕互娱、投资板块等五大业务。

035abcb097b5e02c5afd36b1467ac8cf.png

也正是在这种多元业务转型的过程中,昆仑万维在现今AIGC所涉及的技术范畴里做到了“量的积累”。

正如我们刚才提到的,昆仑天工所涵盖的内容剑指AIGC四大热门领域,即图像、音乐、文本和编程。那么具体到AIGC各细分领域,昆仑万维所开源发布的模型又处于什么水平?

以昆仑天工AI图像能力为例,据了解,天工巧绘SkyPaint是一款多语言的Stable Diffusion分支模型。

换言之,是在保留了Stable Diffusion对英文文本“理解”能力的同时,增加了其对中文提示词的输入能力。

不仅如此,平行语料库的量级达到了1.5亿级别,包含经常能够用到的中英语料,古诗词中英语料,字幕语料,百科语料,图片文字描述语料等语料库的集合。

在训练方面,则是采用了模型蒸馏方案和双语对齐方案,在使用教师模型对学生模型蒸馏的同时辅以解码器语言对齐任务辅助模型训练。

在实验性能结果上来看,也是优于目前已发布支持多语言的AI图像模型:

b3c8edbf75111234f7ff9c25643e1296.png

AI音乐方面,天工乐府SkyMusic是国内第一款商用级作曲AI模型,该模型引入全局信息约束、和弦隐式表征,和弦准确率达到92.5%,远超目前行业最佳64.7%;支持中文、英文、日文、韩文、法文等31种语种,支持从旋律生成歌词、文案素材生成歌词,且支持全球多曲风。

值得一提的是,天工乐府生成的20首AI音乐已经在美国、韩国、印尼等国家及全球180多个音视频平台发布。

昆仑天工在AI文本生成领域是基于千亿量级的数据集训练,最终构建的140亿参数GPT-3生成模型天工妙笔SkyText。

这个模型的一大特点便是涵盖众多细分任务,包括续写、对话、中英翻译、内容风格生成、推理和诗词对联等等。

不仅如此,从实验性能结果上来看,也是优于目前已开源的GPT中文预训练大模型:

e68689c083c5e7ce8a974b952f10b736.png

AI编程领域,昆仑天工所提供的则是一款多语言开源编程大模型。

它支持目前众多主流的编程语言,包括Java、JavaScript、C、C++、Python、Go和Shell等。

在其“嵌入”到VS Code中后,便可以实现代码续写,还是给它“喂”一句中文注释即可的那种。

而在AI编程中,模型的生成通过率可以说是非常重要的性能衡量指标之一,而昆仑天工在实验性能结果上依旧表现不俗:

212b3ceb73dbb6e5e5a2969a307559c9.png

由此可见,昆仑万维在AIGC上的布局并不是一蹴而就的事情,而是在长期发展过程中技术积累后的一种量变。

而“值得关注”的第二点,亦是归于昆仑万维自身——资金实力。

毕竟搞AIGC这件事,单是前期研发投入便需要砸入一大笔资金,并不是小玩家就能“玩得动”的事情。

这一点,从近期披露的财务数据中便可窥知一二。

据昆仑万维发布的2022年半年度业绩来看,单是上半年这六个月,公司便已经实现了22.5亿元的营业收入,整体毛利率水平进一步提高,达到79%。

若是将时间节点拉得更长一些,随着昆仑万维拓展多元业务,并且将人工智能技术不断注入其中,使其各细分业务也产生了较大的变化。

例如Opera浏览器,便从传统浏览器成功向科技驱动的信息分发与元宇宙平台转型,由此带来的营收变化也是肉眼可见。

单是今年上半年,Opera实现营业收入1.5亿美元,同比增长34%,实现经调整后EBITDA 2392万美元,同比增长572%。

截至2022年第三季度,Opera News及元宇宙等新兴业务商业化能力不断提升。其中,云游戏社区GX.Games上线游戏突破2000款,Opera GX月活跃用户超1800万,Opera全球平均月活跃用户达3.21亿。

再如旗下的海外社交娱乐平台StarX,全球注册用户数已超过2.8亿,营收保持强劲增长。Ark Games主打自研的MMORPG新品《圣境之塔》,目前单月最高流水收入已经突破300万美元。

除此之外,昆仑万维在投资领域也斩获颇多。比如最近刚上市的全球最大LGBTQ社交平台Grindr,背后大股东就曾经是昆仑万维,光是这一笔投资就让昆仑万维的收益超过33亿元。

而这一次开源AIGC模型,也是其不断加码科技研发投入的必然结果。

例如在AI图像上,昆仑万维所采用的便是市面上算力最高的显卡集群A100(80G版本),可提供超快速的显存带宽,每秒超过 2 万亿字节,处理超大型模型和数据集。

AI绘画团队对模型训练时间超过了9万个显卡小时,其研发训练所砸的成本可见一斑;不仅如此,在AI文本生成方面,也是通过A100 GPU集群训练得到的最终模型。

据团队透露,昆仑万维自2020年开始布局AIGC开始,便已经投入了数千万元的资金。

有技术积累,有资金研发,而且本身亦是互联网出海巨头,这便是昆仑万维此番动作值得关注的原因了。

而从另一角度来看,昆仑万维的入局也未尝不是对AIGC赛道的一种认可。

因为有实力的玩家们,确实都在迈步于此。

火爆的AIGC赛道

近期AI圈新贵ChatGPT背后的OpenAI,便是AIGC玩家中非常典型的一位。

ChatGPT相当于此前OpenAI提出的GPT的3.5版本,问世5天用户量便达到了100万之多。

而更早一点的Stable Diffusion,也是在仅发布一个月的时间内,其背后的公司便被估值到了69亿元。

这种火爆,未来的市场规模和前景也已经有了推测:

到2030年,AIGC市场规模或将超过万亿人民币。

除了二者之外,国外迈进AIGC领域的巨头玩家不胜枚举,例如谷歌、Meta、英伟达等等,均已将这个赛道视为重点。

而纵观这些玩家的特点,除去拥有充足的研发资金外,还包括有技术、有生态、有落地场景。

反观国内的发展,目前可以说是尚未进入真正的AIGC阶段,这一点在量子位智库的《AIGC/AI生成内容产业展望报告》中有所提及。

虽然在细分赛道上出现了个别优秀的先行公司及研究机构,但目前行业尚未进入大规模验证和体系化发展的阶段。

例如在场景上来看,目前最关键的是内容领域需求较为饱和,且降本增效尚不够迫切。细分来看,虚拟人行业将成为产业中短期增长的关键动力。玩家需要寻找容错率较高、专业度或创意要求有限的场景。

但长期而言,AIGC依旧需要有需求更加清晰且明确的消费落地场景,例如实时性场景(如实时互动、实时反馈类场景)和高度个性化生成场景。

再如玩家方面,国内目前的初创玩家数量较少,大部分细分赛道的初创玩家在5家以下,大部分为具有相关业务大厂/研究机构的内部探索项目。

因为市场规模短期内相对有限,且渠道和前期资源的积累需要较长时间,我们认为后期会更容易出现高行业集中度。
技术方面,除去个别布局较早的企业外,国内AIGC领域大规模稳定生产的能力还需进一步增强,完成从尝鲜式做法向正式和业务化的进入各类场景的转化。

据业内人士估计,预计2-3年内,各AIGC能力有望在成本可控的前提下,实现工业化生产。

最后是在变现方面,尽管国内的Game AI、虚拟人、TTS、结构化文本写作等领域已形成稳定的业务合作关系及收入关系,但行业整体的变现能力仍待进一步证明。且基本为项目制/长期项目制,标准化/平台化产品欠缺发育。

因此,种种分析下来,对于国内AIGC的发展现状,我们可以认为仍旧处于一种尝试阶段,大部分情况下AIGC尚未进入业务场景,变现能力有待增长。

那么接下来需要讨论的一个问题便是:昆仑万维的入局又会带来怎样的改变?

从技术和研发资金等方面来看,正如我们刚才提到的,昆仑万维是具备踏入AIGC门槛的资格。

而从此次开源并发布四大模型来看,昆仑万维要做的重点更是在于推动生态的发展建设,不仅仅是纯做应用那么简单,而是从模型层上出发掌握更多主动权。

首先是从昆仑万维自身维度来看,其在全球平均月活跃用户近4亿,并且已然涉猎的多元业务覆盖AIGC多个重要场景。

这样正是符合国外巨头玩家们“有生态”、“有落地场景”的特点。

不仅如此,对于国内AIGC现阶段最为难解的变现问题,昆仑万维也发表了它的观点:

模型开源后不收费,但可以通过如Mango DB 、Databricks的方法,在商业支持、云服务方面去收费,形成收入来源。
我们的对标公司是Databricks、MongoDB和正在成功的 Stability AI,这些公司在资本市场的市值也不低。
我们坚信开源的迭代速度远远超过闭源,终极目的是让开源云项目起到大厂Saas的补充,给中小企业、中小开发者、普通开发者更好的选择。

那么对于国内AIGC新晋巨头玩家的这套“打法”,你有什么看法呢?

—  —

点这里

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道 的相关文章

  • Python实现红黑树的删除操作

    Python实现红黑树的删除操作 本专栏的上一篇文章使用Python实现了红黑树的插入操作 参考 https blog csdn net weixin 43790276 article details 106456969 本篇文章使用Pyt
  • STL模板简介

    STL是C 中的优秀作品 有了它的陪伴 许多底层的数据机构以及算法我们不需要自己写 可以直接用STL里面的 就相当于我们站在巨人的肩膀上 飞一般地向前进 一 什么是STL STL standard template library 标准模板
  • H5跳转微信小程序-成功案例(VUE)(踩坑无数)

    这里写自定义目录标题 准备工作 根据官方提供的资料需准备以下几点 1 已认证的服务号 2 绑定JS接口安全域名 在微信公众平台设置 3 IP白名单 在微信公众平台设置 4 将小程序和H5公众号进行关联 在微信公众平台设置 5 页面path和
  • paramiko 无法实例化 transport

    背景 Paramiko is a pure Python 1 2 7 3 4 implementation of the SSHv2 protocol 2 providing both client and server functiona
  • python信号处理算法库_语音信号处理之时域分析-音高追踪及其Python实现

    1 概述 在音高及其Python实现一文 中 我们使用了简单的 观察法 来计算音高 这并不太难 但这并不有好而且费时费力 那么我们就想 如何通过分析和计算 使用算法来自动计算音高呢 用算法让计算机自动抓取音高的过程 称为音高追踪 Pitch
  • Flex 布局教程:语法篇

    网页布局 layout 是 CSS 的一个重点应用 布局的传统解决方案 基于盒状模型 依赖 display 属性 position属性 float属性 它对于那些特殊布局非常不方便 比如 垂直居中就不容易实现 2009年 W3C 提出了一种
  • Glog 使用

    原文链接 glog使用
  • Java复习-26-枚举

    枚举 替换多例设计 目的 使用场景 不用也没啥 定义一个描述性别的类 那么该对象只有两个 男 女 或者描述颜色基色的类 可以使用 红色 绿色 蓝色 功能 用于定义有限个数对象的一种结构 多例设计进化版 方法 enum 关键字 提供有enum
  • 从码云上克隆代码到IDEA及项目启动

    码云版本库地址复制 输登录代码库系统 找到 版本库 点击 版本库地址 下拉列表 选中 http zjs 190 100 21 10 1001 r aqjg extern project git 版本库地址复制 如果不是首次clone项目可直
  • 头歌答案Python,001

    金宝 答案在这里 自己抄 1 第一关 计算机 num 1 int input 请输入第一个数 print num 1 num 2 int input 请输入第二个数 print num 2 alg input 请选择要执行的运算符 prin
  • 单测mock和stub

    A variety of different terms are used to refer to these custom objects In an effort to clarify the vocabulary Gerard Mes
  • Design1.CMOS工艺OD门,传输门,三态门原理应用浅析

    纲要 OD门 传输门 三态门 1 OD门 i 概念 在CMOS电路中为了满足输出电平变换 吸收大负载电流以及实现线与连接等需要 需要将输出级电路结构改为漏极开路输出的MOS管 构成漏极开路输出 Open Drain Output 门电路 简
  • Android中的Selector的用法

    Android中的Selector主要是用来改变ListView和Button控件的默认背景 其使用方法可以按一下步骤来设计 以在mylist view xml为例 1 创建mylist view xml文件 首先在res目录下新建draw
  • 栈与队列小总结

    思维导图 一 栈 栈 一种数据结构 具有后进先出的特点 有两种实现方式 第一种实现方式就是用数组结构来实现 第二种方式就是用链表的方式来实现 但是由于使用数组的方式来实现栈会更加的好 所以在这里我们用数组的方式来实现栈 栈的实现 1 栈的结
  • 红蓝对抗--蓝队

    2019年参加护网行动的时候 想着是信安专业 可以去赚点零花钱 蓝队的工作 后面总结了一下护网行动和蓝队的一些工作重心 刚刚换电脑的时候翻出来了这个文章 只是个人拙见 大佬勿喷 文章目录 一 团队组建 二 梳理资产 三 风险梳理 四 减少攻
  • 面试求职经历及遇到的部分问题

    转眼间已经工作一年多了 最近想换个工作环境 就选择了跳槽 跳槽对我们程序猿来说并没什么稀奇 但这是我第一次跳槽 也颇感激动 哈哈 总的来说 这次找工作还是相对去年来说比较容易的 毕竟已经工作一年了嘛 记得去年的时候投20份简历也不一定会有面
  • Lesson 7 Edge I

    一 图像分割与不连续 图像分割 segmentation 的目的是把图像中的像素分组 每组像素和图像中的物体强相关 图像分割需要确定图像中的不连续处 不连续处 discontinuity 包括孤立点 线段和边缘 edge 我们首先介绍edg
  • eclipse的new server里tomcat7.0根本选不上解决方法

    创建Tomcat v7 0 Server 不能进行下一步 解决方法 1 退出 eclipse 2 到 工程目录下 metadata plugins org eclipse core runtime 3 把org eclipse wst se
  • 查看函数和所在的行号

    查看Linux下 a库文件中文件 函数 变量等情况 2013 02 24 16 11 02 转载 在Linux 下经常需要链接一些 a的库文件 那怎么查看这些 a 中包 含哪些文件 函数 变量 1 查看文件 ar t a 2 查看函数 变量
  • 最全的Linux运维bash脚本常见用法总结

    删除重复的数组元素 创建临时关联数组 设置关联数组 值并发生重复赋值时 bash会覆盖该键 这 允许我们有效地删除数组重复 CAVEAT 需要bash4 示例功能 remove array dups Usage remove array d

随机推荐

  • 所有pyCharm2018或phpstorm2018版永久激活,亲测无问题

    注意 实际测试软件版本为phpstorm2018 2 3 破解补丁激活 到http idea lanyus com 这里下载补丁 下载 后并将 JetbrainsCrack release enc jar 放置到 D盘根目录 在 Pycha
  • [STM32F4]【把握住了】STM32F4驱动4路VL53L0测距你把握不住

    最近给朋友调试了STM32F407驱动VL53L0的激光测距 安装在机器人上的 遇到一些问题 这里发帖纪录一下 关于VL53L0的资料和代码在正点原子那里都有 但是正点原子只是驱动了一路VL53L0 很多问题都需要我们自己解决 一路的VL5
  • Pikachu靶场之XSS漏洞详解

    Pikachu靶场之XSS漏洞详解 前言 XSS漏洞简述 第1关 反射型xss get 第2关 反射性xss post 第3关 存储型xss 第4关 DOM型xss 第5关 DOM型xss x 第6关 xss盲打 第7关 xss之过滤 第8
  • ATM 网络安全:解决方案、技术和规格--网络大典

    比起 TCP IP 网络 异步传输模式 ATM 网络通常拥有较少的安全漏洞 因为它通常使用光纤作为媒介 并被当作骨干网络用于专用或半专用网络中 侵入 ATM 网络所需的投入是相当高的 然而在 ATM 网络中仍然存在着许多弱点 如信息嗅探 基
  • RTT-线程管理

    RTT 线程管理 官方API文档 https www rt thread org document api group thread html 概念 线程是竞争系统资源的最小运行单元 每个线程在自己的环境中运行 在任何时刻 只有一个线程得到
  • pip 安装 flask_sqlalchemy 报错

    报错一 Errno 13 Permission denied 报错二 ERROR After October 2020 you may experience errors when installing or updating packag
  • Mac电脑如何删除磁盘及双系统分区?

    对于一些新手来说 在使用Mac电脑时可能会选择对硬盘进行分区或者安装双系统 但是 如果后期不需要这些分区时 如何删除它们呢 首先在应用程序中找到实用工具并打开文件夹 然后选择磁盘工具打开 在左侧选中需要修改的磁盘 接着在右侧上方菜单中点击
  • 【当LINUX系统出现网络问题时该如何排查】

    当LINUX出现网络问题时该如何排查 具体问题具体分析 遵循相应的排查思路 一 网络不通时需要进行的处理 1 检测链路是否连通 2 网卡是否正常启用 3 检测路由与网关的配置 4 DNS工作状况 5 检测是否可以正常路由到远程主机 6 检查
  • selenium无登录状态爬取Boss直聘

    BOSS是我很早就实现数据爬取的网站 那会直接用request即可 最近再次尝试以前的代码发现 它做了一些反爬处理 当你直接访问例如https www zhipin com c101210100 b 西湖区 query 数据分析杭州这样的网
  • C++模板基础(五)

    函数模板 函数模板的 完全 特化 template lt gt void f int template lt gt void f int 并不引入新的 同名 名称 只是为某个模板针对特定模板实参提供优化算法 函数模板的特化本质上是实例化 有
  • SQL Server不允许保存更改的解决方法

    点击上面的 工具 选项 在选项对话框中 点击 设计器 表设计器和数据库设计器 去掉 阻止保存要求重新创建表的更改 前面的勾 然后确定 好啦 再去试试吧 应该可以正常修改表的结构啦 o
  • 【NLP】第 2 章 : Transformers简介

    2017 年 12 月左右 发表了一篇题为 Attention Is All You Need 的开创性论文 这篇论文彻底改变了 NLP 领域在未来时代的面貌 本文描述了转换器和所谓的序列到序列架构 序列到序列 或 Seq2Seq 神经网络
  • Excel2013 利用phonetic函数将多行数据合并到同一单元格中

    场景 有一列邮箱数据 现在需要将他们合并到同一个单元格内 且邮箱之间要用英文的逗号隔开 以前五条邮箱为例 利用phonetic函数实现这种合并 合并结果 其中 E列是添加的辅助列
  • Python 调用Sikuli Jar包

    Python 调用Sikuli Python 目录 Sikuli简介 简要说明 环境设置 第一种 Jpype 第二种 Pyjnius 结论 目录 Sikuli简介 Sikuli是由MIT 麻省理工学院 研究团队发布的一种图形化编程技术 编程
  • 实现SSM简易商城项目的商品查询功能

    实现SSM简易商城项目的商品查询功能 介绍 在SSM Spring SpringMVC MyBatis 框架下 我们可以轻松地实现一个简易商城项目 本博客将重点介绍如何实现商品查询功能 帮助读者了解并掌握该功能的开发过程 步骤 1 创建数据
  • LeetCode-1306. Jump Game III

    Given an array of non negative integers arr you are initially positioned at start index of the array When you are at ind
  • 用Flask和Vue制作一个单页应用(自己学习)

    这里以一个简单的例子 展示如何把前端页面的增删改查请求 传递到后端进行数据的操作 一 https zhuanlan zhihu com p 311323583 二 https zhuanlan zhihu com p 311510196 三
  • 王者荣耀s15服务器维护,王者荣耀s15赛季更新全部内容

    原标题 王者荣耀s15赛季更新全部内容 王者荣耀S14很快就要结束了 体验服的版本更新也已经放出来进行测试了 大家都对新赛季的改动非常期待 究竟会有哪些英雄成为新的版本之子 哪些英雄会沦为下水道呢 以下均为体验服内容 不代表最终版本数据 p
  • 栈和队列 Stack and Queue

    Stack and Queue Stack and Queue Linked List Implementation ListNode Stack Queue Array Implementation Stack Queue Stack a
  • 又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道

    金磊 发自 凹非寺量子位 公众号 QbitAI AIGC AI生成内容 这个概念在今年可以说是火得一塌糊涂 例如Stable Diffusion 只要对它说一句话 唰唰唰 地就能秒生成画作 再如最近大火的ChatGPT 对答如流堪比人类 简
Powered by Hwhale