英伟达闲着没事,做了一个超级逼真的人脸生成AI系统!

2023-11-05

Nvidia 英伟达的人脸面部表情方法真的是GAN-风格。

一种新的生成性对抗网络方法让技术观察者摸不着头脑:图像如何虚假而又看起来如此真实?

研究人员在一段视频中说:“我们想出了一种新的发生器,可以自动学习分离图像的不同方面而无需任何人为监督。” 他们在他们的论文中指出,“新架构导致了自动学习,无监督的高级属性分离。”

基于样式的生成器(config F)使用FFHQ数据集生成的未经计算的图像集。

让假照片看起来真实是一种艺术上的努力,这并不是什么新鲜事,但这三位研究人员将努力提升到了一个新的水平。

他们在他们的论文“用于生成对抗网络的基于样式的生成器架构”中阐述了他们的技术。 这篇论文是关于arXiv的,它引起了很多关注。

Big Think的斯蒂芬约翰逊说结果“非常令人吃惊”。 麻省理工学院技术评论中的Will Knight说我们所看到的是“惊人的,几乎令人毛骨悚然的现实主义”。

研究人员Tero Karras,Samuli Laine和Timo Aila来自Nvidia。 他们的方法侧重于构建一个生成的对抗网络,即GAN,在那里学习可以生成模仿真实照片外观的全新图像。

作者说,这个视频中的所有图像都是由他们的发生器产生的。 “他们不是真人的照片。”

他们的论文“骑士说,”展示了如何使用这种方法,并重新混合种族,性别,甚至雀斑等元素。

魔术酱是他们的基于风格的发电机。 Big Think将此解释为用于自动生成图像的传统技术的修改版本。

他们的技术正在弄乱你的头,笑到最后(或者说,无论你怎么看)。

你作为一个人类认为“图像”。 然而,发电机认为“风格集合”。

每种风格都以特定的比例控制效果。款式粗犷,款式中等,款式精美。 (粗略的样式指的是姿势,头发,脸型;中间的样式指的是面部特征;眼睛。精细的样式指的是配色方案。)

与此同时,Will Knight对GAN进行了一些观察:“GAN使用两个决斗神经网络来训练计算机,以便足够好地学习数据集的性质以产生令人信服的假货。当应用于图像时,这提供了一种经常高度生成的方法逼真的伪造。“

通过使一个潜在代码(源)生成的样式覆盖另一个(目标)的样式的子集,可视化生成器中样式的效果。

约翰逊提供了GAN概念的背景:

“2014年,一位名叫Ian Goodfellow的研究人员和他的同事写了一篇论文,概述了一种新的机器学习概念,称为生成对抗性网络。简单来说,这个想法涉及将两个神经网络相互对立。一个充当发现者的视角比方说,狗的图片,然后尽力创建一个它认为狗的样子的图像。另一个网络充当鉴别器,试图从真实的图像中辨别假图像。

 

说到计算机视觉功能的发展用例,谷歌曾经在2017年发布了一款AI硬件纸盒套件(也是旗下AI开源项目(AIY Projects)的作品)。其中,AIY Vision Kit 就是一套简单的计算机视觉系统,它可以检测几千种常见物体,也可以对人类的脸部表情进行检测,并显示出情绪,比如微笑、皱眉、愤怒、开心等等。它还可以识别人、猫、狗。这些都得益于神经网络技术。

 

“起初,发生器可能会产生一些看起来不像狗的图像,因此鉴别器会将它们击落。但是发生器现在知道它出错的地方,所以它创建的下一个图像稍微好一些。 从理论上讲,发电机一直持续到造成狗的良好形象。“

Nvidia的团队将风格转移原则添加到GAN组合中。

TechCrunch中的Devin Coldewey:“汽车,猫,风景 - 所有这些东西或多或少都符合可以单独隔离和再现的小型,中型和大型功能的相同范例。”

 

从技术角度来看,他们的作品在看起来真实的人的图像中得到了令人印象深刻的结果。 从流行的观点来看,通过谈论虚假新闻加剧,这种进步被认为是危险的。 约翰逊说:“生成逼真的人工图像的能力,通常被称为深度伪造,当图像看起来像可识别的人时,近年来引起了人们的关注。”

技术观察网站页面上充斥着关于“令人毛骨悚然”的评论,有些评论只是问题:“我们为什么要这样做?” “谁来支付它?” “如果我们不建立监管界限,我认为人类历史的下一场重大战役将与我们创造的人工智能进行斗争(并可能失败),”一位回应说。

尽管如此,并非所有评论都反映出不安。 这是一项技术进步,一些评论指出,应用程序可能对某些部门有所帮助。 设计师,广告代理商创建者,甚至视频游戏创作者都可以使用这项技术。

“这些人工智能生成的面孔有望在视频游戏和电影中引入新一代逼真的人,而不需要人类演员或演员,”HotHardware说。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

英伟达闲着没事,做了一个超级逼真的人脸生成AI系统! 的相关文章

  • 深度好文:最全的大模型 RAG 技术概览

    本文是对检索增强生成 Retrieval Augmented Generation RAG 技术和算法的全面研究 对各种方法进行了系统性的梳理 涉及了 RAG 流程中的数据拆分 向量化 查询重写 查询路由等等 在做 RAG 的小伙伴一定知道
  • 【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究(Python代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 2 1 有 无策略奖励 2 2 训练结果1
  • 蒙特卡洛在发电系统中的应用(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 蒙特卡洛在发电系统中的应用(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 问CHAT很繁琐的问题会不会有答案呢?

    问CHAT 什么已有的基于极值理论的极端温度重现期主要针对极端高温事件 对极端低温事件研究较少 CHAT 回复 为这主要可能是由于以下几个原因 1 气候变化与全球变暖 当前 全球变暖和气候变化的问题备受关注 这导致科研者更加关注极端高温事件
  • Soul App:年轻人的社交状态,还有多少种可能?

    查尔斯 狄更斯在 双城记 的开篇写下 这是最好的时代 这是最坏的时代 这是智慧的时代 这是愚蠢的时代 这是信仰的时期 这是怀疑的时期 人们面前有着各样事物 人们面前一无所有 既然万事万物都和狄更斯所说般 好坏参半 那又何必执着于过去 苦恼于
  • socket网络编程几大模型?看看CHAT是如何回复的?

    CHAT回复 网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型 一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求 不需
  • 基于java的ssh医院在线挂号系统设计与实现

    基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机 基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机 随着信息技术的迅速发展和应用 医院在线挂号系统已成为医院管理的重要组成部分 传统的挂号方式存在许多
  • 扬帆证券:三只松鼠去年扣非净利预增超1.4倍

    在 高端性价比 战略驱动下 三只松鼠 300783 重拾增势 1月15日晚间 三只松鼠发布成绩预告 预计2023年度净赢利为2亿元至2 2亿元 同比增加54 97 至70 47 扣非后净赢利为1亿元至1 1亿元 同比增速达146 9 至17
  • 明日 15:00 | NeurIPS 2023 Spotlight 论文

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入 哔哩哔哩直播通道 扫码关注AITIME哔哩哔哩官方账号预约直播 1月17日 15 00 16 00 讲者介绍 黄若孜 腾讯AI LAB游戏AI研究员 2020年复旦大学硕士毕业后
  • 毕业设计:基于卷积神经网络的图像分类系统 python人工智能

    目录 前言 设计思路 一 课题背景与意义 二 算法理论原理 2 1 卷积神经网络 2 2 SVM算法 三 检测的实现 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力
  • 作物叶片病害识别系统

    介绍 由于植物疾病的检测在农业领域中起着重要作用 因为植物疾病是相当自然的现象 如果在这个领域不采取适当的护理措施 就会对植物产生严重影响 进而影响相关产品的质量 数量或产量 植物疾病会引起疾病的周期性爆发 导致大规模死亡 这些问题需要在初
  • 做大模型也有1年多了,聊聊这段时间的感悟!

    自ChatGPT问世以来 做大模型也有1年多了 今天给大家分享这一年后的感悟 过去一年应该是AI圈最万千瞩目的一年了 大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注 以至于有一年的时间好像经
  • 2023最新pytorch安装(超详细版)

    前言 一 判断是否有Nvidia 英伟达显卡 二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功 三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
  • 人工智能 AI 如何让我们的生活更加便利

    每个人都可以从新技术中获益 一想到工作或生活更为便利 简捷且拥有更多空余时间 谁会不为之高兴呢 借助人工智能 每天能够多一些空余时间 或丰富自己的业余生活 为培养日常兴趣爱好增添一点便利 从电子阅读器到智能家居 再到植物识别应用和智能室内花
  • CorelDRAW2024官方中文版重磅发布更新

    35年专注于矢量设计始于1988年并不断推陈出新 致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长 在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
  • 蒙特卡洛在发电系统中的应用(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 开始弃用NeRF?为什么Gaussian Splatting在自动驾驶场景如此受欢迎?(浙江大学最新)...

    点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述 文章首先回顾了3D Gaussian的原理和应用 借着全面比较了3D GS在静态
  • 国产化率100%,北斗导航单日定位4500亿次,外媒:GPS将被淘汰

    追赶30年的技术差距 国产卫星导航系统 北斗 开始扬眉吐气 数据显示 北斗导航目前单日定位量达4500亿次 已经获得100多个国家的合作意向 甚至国际民航也摒弃以往 独宠 GPS的惯例 将北斗纳入参考标准 对此 有媒体直言 GPS多年来的技
  • 自动驾驶离不开的仿真!Carla-Autoware联合仿真全栈教程

    随着自动驾驶技术的不断发展 研发技术人员开始面对一系列复杂挑战 特别是在确保系统安全性 处理复杂交通场景以及优化算法性能等方面 这些挑战中 尤其突出的是所谓的 长尾问题 即那些在实际道路测试中难以遇到的罕见或异常驾驶情况 这些问题暴露了实车

随机推荐

  • vue中使用简单的回调函数

    使用场景 比如 多个新增接口一样 只是新增之后调用的列表接口不一致 this getTalkBy 列表接口的回调 调用 this getAddTalkLike this getTalkBy 新增接口 getAddTalkLike callb
  • 大神总结的图像处理学习路线

    图像处理 第一阶段 熟悉图像算法 推荐中科院研究生院刘定生老师的数字图像处理与分析 视频 配套的书籍 冈萨雷斯版数字图像处理 同时用matlab软件 仿真每一个图像算法案例 推荐 matlab宝典 第二阶段 认真学习C 推荐 C Prime
  • 基于Smack3.0.4+ Openfire3.10.2开发之Android 客户端之四

    我们在之前依次介绍openfire部署以及smack常用API的使用 这一节中我们着力介绍如何基于asmack开发一个Android的客户端 本篇的重点在实践 讲解和原理环节 大家可以参考前面我所发布的OpenFire和Smack的相关文章
  • 10.JavaWeb-logback日志

    1 日志的概念 日志是用于记录软件系统运行时状态和事件的重要工具 在软件开发中 日志是一种常用的调试和故障排查手段 同时也可以用于性能分析 用户行为追踪和系统监控等方面 1 1日志特点 灵活性 可以根据需要配置日志的级别和输出目标 方便在不
  • MCU和DSP区别

    1 概述 随着处理器技术的不断发展 目前来看CPU Central Processing Unit 逐渐出现三种分支 分别是DSP Digital Signal Processing Processor 数字信号处理 以及MCU Micro
  • 第四天笔记

    1 盒子模型 内边距 应用于所有边 padding 1em 上边下边 左边右边 padding 5 10 上边 左边右边 下边 padding 1em 2em 2em 上边 右边 下边 左边 padding 5px 1em 0 2em 全局
  • JavaScript给URL追加参数

    代码 appendQuery url key value gt var options key if typeof options string options options key value options param options
  • 傅里叶变换在图像处理中的应用

    目录 基本概念 超详细的图像中傅里叶理解及常用模板 请参考 https blog csdn net m0 37264397 article details 70186390 应用一 使用C opencv对图像进行傅里叶变换 再根据频谱图对原
  • STM32----IIC详解

    一 IIC简介 1 IIC总线概述 IIC总线是飞利浦公司研发的两线制串行通信总线 IIC两线制包括 串行时钟线 SCL 和串行数据线 SDA 串行时钟线 SCL 只能由主器件控制 串行数据线 SDA 实现双向数据传输 IIC通信属于同步
  • 在IE中使用ActiveX控件,需要使用HTML中的标志是

    在 中使用ActiveX控件 需要使用HTML中的标志是
  • 【C语言】二分查找(含图解)

    文章目录 1 二分查找思想 2 代码实现 2 1 未封装函数 2 2 封装函数 使用while循环 2 3 封装函数 使用递归 1 二分查找思想 二分法 二分查找算法是一种在有序数组中查找某一特定元素的搜索算法 其思想就是不断地将有序查找表
  • 5.2 可变参数

    5 2 可变参数 Lua函数可以接受可变数目的参数 和C语言类似在函数参数列表中使用三点 表示函数有可变的参数 Lua将函数的参数放在一个叫arg的表中 除了参数以外 arg表中还有一个域n表示参数的个数 例如 我们可以重写print函数
  • JAVA根据模板生成PDF文件并导出

    JAVA根据模板生成并导出PDF 实现功能 根据模板生成PDF文件 模板文件参数可配 可手动修改 一 PDF导出效果 先看一下导出的demo文件 具体样式可手动修改 下图为demo pdf ftl导出PDF文件 下图为list pdf ft
  • 图像分割之Unet解析及实现代码

    Unet解析及实现代码 论文连接 https arxiv org pdf 1505 04597 pdf 源码连接 https github com FENGShuanglang unet 图像分割 Unet网络结构详解 Unet网络结构 o
  • c++ auto关键字使用

    C 11 auto可以在声明变量的时候根据变量初始值的类型自动为此变量选择匹配的类型 类似的关键字还有decltype 举个例子 int a 10 auto au a a 自动类型推断 au a为int类型 cout lt lt typei
  • 在 NLP 中训练 Unigram 标记器

    介绍 单个标记称为 unigram Unigram 标记器是一种只需要一个单词来推断单词的词性标记器类型 它有一个单词的上下文 NLTK库为我们提供了UnigramTagger 并从NgramTagger继承而来 在本文中 让我们了解 Un
  • UDP实现点对点聊天(多线程)-C语言

    UDP实现点对点聊天 多线程 服务器端 操作步骤 1 编译 gcc UDPM c lws2 32 lmycon lwinmm o UDPM exe 2 运行 UDPM include
  • umi框架编写简单的验证码登录

    首先我们需要先创建一个layouts的文件夹 用来存储跳转动画的文件 layouts的文件夹和pages同级 然后在pages中创建一个login文件夹用来存储登录文件 然后再里面创建login和index文件开始编写代码 接下来就是废话不
  • 开开心心带你学习MySQL数据库之第六篇下

    插入查询结果 把查询和新增联合起来 把查询结果作为新增的数据 例子 把student1表的查询结果作为新增数据插入到student2表中 create table student1 id int name varchar 20 create
  • 英伟达闲着没事,做了一个超级逼真的人脸生成AI系统!

    Nvidia 英伟达的人脸面部表情方法真的是GAN 风格 一种新的生成性对抗网络方法让技术观察者摸不着头脑 图像如何虚假而又看起来如此真实 研究人员在一段视频中说 我们想出了一种新的发生器 可以自动学习分离图像的不同方面而无需任何人为监督