科技，让二次元老婆动起来

2023-11-09

想让你的二次元老婆动起来吗？

前不久，Meta（也就是Facebook）发布了一款有趣的AI工具Animated Drawings，它可以让静态的儿童画动起来。

有些懂行的朋友一看就说“哎呀这不就是关键点检测再加动态化嘛”。

道理是这个道理，但是儿童画的特点是简单而又五花八门，能适配这种画作可不是容易的事情。

由于我的画功也不比小朋友强多少，下面就用我即兴发挥的一副大作来做个测试吧。

1 上传图片

首先，准备你的大作，在干净的纸上画一个角色，人类或者动物都可以，点击upload上传。

然后点击Next进入下一步。

2 裁剪图片

Animated Drawings会自动帮你裁剪图片到刚好覆盖你的角色，你也可以自己拖动裁剪，尽量减少无用的部分。

裁剪后点击Next进入下一步。

3 选择角色范围

这一步很像PS中的蒙版，我们需要把你的角色的具体部分进行高亮表示，这是因为有些小朋友画的确实过于离奇，导致没有识别出正常的四肢。

我这一幅画比较标准，所以自动识别效果已经很好了，不需要做什么改动了。

4 调整关键点

这是关键的一步，模型会检测你的角色中的关键点。

所谓关键点，就是比如你的五官、肘关节、膝关节、手脚等关键节点。想象你小时候玩的机器人，不就是通过活动这些部分让它“动起来”嘛，这里也是一样的。

5 让我们动起来吧！

现在我们就可以看到结果了！

这里展示一下兔子先生动起来的样子。

实际上，你用真人照片或者喜欢的二次元角色效果也是一样的，这不就可以让你的二次元老婆动起来了嘛，可见，科技让我们的生活更好！（不是

快来试试吧！官网链接是https://sketch.metademolab.com/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能

scratch

人脸识别

ui

OCR

科技，让二次元老婆动起来的相关文章

自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾
AI 赋能绿色制冷，香港岭南大学开发 DEMMFL 模型进行建筑冷负荷预测

近年来城市化进程加速所带来的碳排放量骤增已经严重威胁到了全球环境多个国家均已给出了碳达峰碳中和的明确时间点一场覆盖全球全行业的绿色革命已经拉开序幕在一众行业中建筑是当之无愧的能耗大户其中又以暖通空调 Heating
描边宽度变换 (SWT) 实现（Java、C#...）[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我最近发现了笔划宽度变换如以下研究论文中所述使用笔划宽度变换检测自然场景中的文本 https ie
如何在 OCR 中区分斜线零和八 (0->8)

我正在为我的 Android 应用程序使用 ML Kit for Firebase ReCalc 收据计算器 https play google com store apps details id info trekto receipts
Tesseract OCR Android tessdata 目录未找到

我目前正在使用 OCR 开发 Android 应用程序并且已经达到了调用 BaseAPI init 方法的程度我不断收到错误消息指出该目录必须包含 tessdata 作为子文件夹我已检查文件目录是否包含其中包含训练数据文件的文件夹
Microsoft Azure 认知服务手写检测边界框参数

我目前正在使用Microsoft Azure 认知服务手写检测 API https learn microsoft com en in azure cognitive services computer vision quickstarts
Pytesseract 对于实时 OCR 来说非常慢，有什么方法可以优化我的代码吗？

我正在尝试使用 python 创建实时 OCRmss and pytesseract 到目前为止我已经能够捕获整个屏幕其 FPS 稳定为 30 如果我想捕获大约 500x500 的较小区域我已经能够获得 100 FPS 然而一旦我包
提高识别率的图像预处理步骤

我正在为我的项目使用 TessBaseAPI 制作一个简单的 OCR Android 应用程序我已经完成了一些图像预处理步骤例如二值化和图像增强但他们的结果是50 到60 怎样才能提高识别率呢我包括两个示例图像 http image
我自己的 Python OCR 程序

我还是一个初学者但我想写一个字符识别程序这个程序还没有准备好而且我编辑了很多所以评论可能不完全一致我将使用 8 个连通性来标记连通分量 from PIL import Image import numpy as np im Ima
使用 OpenCV 对 Tesseract OCR 进行图像预处理

我正在尝试开发一个应用程序它使用 Tesseract 来识别手机摄像头拍摄的文档中的文本我使用 OpenCV 来预处理图像以实现更好的识别应用高斯模糊和阈值方法进行二值化但结果非常糟糕 Here https s6 postimg c
断言失败 - 训练 Tesseract

我正在尝试使用 Serak Tesseract Trainer 训练 tesseract https code google com p serak tesseract trainer https code google com p ser
使用背景校正图像 (Python)

我正在开发一个项目对标签上的文本进行 OCR 操作我的工作是对图像进行倾斜校正使其可以用超正方体读取 I have been using this approach https www pyimagesearch com 2017 0
裁剪图像后，如何找到新的边界框坐标？

这是我得到的收据图像我使用 matplotlib 绘制了它 x1 y1 x2 y2 x3 y3 x4 y4 bbox coords 650 850 1040 850 1040 930 650 930 image cv2 imread IM
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
训练 tesseract 与 iPhone 一起使用

我正在尝试在我的 iPhone 应用程序中使用 tesseract 2 04 只想检测数字我在这里所做的首先是使用这篇文章交叉编译 tesseract 以生成 lib 文件http robertcarlsen net 2009 07 15
在Tomcat中设置环境变量TESSDATA_PREFIX

我们正在使用名为 Tess4J 的 Tesseract OCR Java 库如果作为独立应用程序运行它可以正常工作它需要一个名为 TESSDATA PREFIX 的变量其中包含 tessdata 配置和其他字符集相关文件它也可以与
如何在 Ubuntu/Linux 发行版中安装 Tesseract-OCR 3.03？

我和一个朋友有兴趣为 CV 项目训练 tesseract OCR 引擎我们尝试使用一些包装器例如 PyTesser 和 pyocr 但结果目前不如我们需要的那么准确因此我们希望尝试训练超立方体以更好地实现我们的目的即识别食品标签上
无法将 Tesseract OCR 模块添加到 Android Studio

我按照此处找到的分步指南进行操作 https www codeproject com Articles 840623 Android Character Recognition https www codeproject com Artic
找不到仅适用于数字的 Tesseract 4.0 tessdata

正如这篇文章中所说 pytesseract 仅使用 tesseract 4 0 数字不起作用 https stackoverflow com questions 46574142 pytesseract using tesseract 4

随机推荐

数据结构笔记之链式栈的基本操作

include stdio h include stdlib h include io h include math h include time h define OK 1 define ERROR 0 define TRUE 1 def
VMWare安装

1 1 VMWare简介 VMWare是一个虚拟技术的合集它提供了众多的相关软件类似于Parallels VMWare是商业应用而且价格非常的贵所以通常我们使用的是网上别人破解的版本而不是使用官方的正版 VMWare官网 VMw
【UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3 in position 0: invalid continuation byte】

UnicodeDecodeError utf 8 codec can t decode byte 0xd3 in position 0 invalid continuation byte F jupyter work dir MMLAB m
有一个公网IP，在内网如何架设多台服务器?

进行内网ip到外网ip的映射也就是pat 这个工作现在多半由防火墙来完成不过如果没有防火墙用路由器也可以完成只不过会在高峰时加重路由器的负担思科2600路由可以独立完成各种nat pat但是因为这款产品本身属于低端产品所以能够担
Java8学习记录(一)——Lambda表达式

这两天看了 Java8实战做一下记录目录一行为参数化 1 什么是行为参数化二函数式接口 1 概念三 Lambda表达式四方法引用注意点 1 静态方法引用 2 实例方法引用重点来了任意类型的实例方法引用现有对象的实例
【深度学习】树莓派Zero w深度学习模型Python推理

在机器学习开发过程中当模型训练好后接下来就要进行模型推理了根据部署环境可分为三类场景边缘计算一般指手机嵌入式设备直接在数据生成的设备上进行推理因为能避免将采集到的数据上传到云端所以实时性非常好端计算介于云和边缘设备之间
Spring Boot 集成Mybatis实现多数据源

总体来说多数据源配置有两种方式一种是静态的一种是动态的静态的方式我们以两套配置方式为例在项目中有两套配置文件两套mapper 两套SqlSessionFactory 各自处理各自的业务这个两套mapper都可以进行增删改查的操
GPU版本安装Pytorch教程最新方法

目录步骤第一步安装 Anaconda 和 Pycharm 软件第二步下载安装CUDA11 3 1 首先查看自己电脑GPU版本方式一搜索框输入nvidia 打开nvidia控制面板方式二 win R打开cmd 输入nvidia
ubuntu的FTP服务器搭建

1 安装服务器 sudo apt get install vsftpd 如果有错误先执行 apt update 2 创建用户 Linux下的用户创建专用目录 mkdir home ftp 命令添加ftp用户 sudo useradd d
基于tiny6410的led驱动程序

今天弄了一个晚上了终于弄懂了第一个简单的linux驱动感觉很多人编写的第一个驱动也是拿led开刀的吧本文的led驱动是基于tiny6410的四个led驱动用字符设备的驱动模块而不是混杂设备驱动模块来编写本人在使用混杂设备方法编写的
5735. 雪糕的最大数量

夏日炎炎小男孩 Tony 想买一些雪糕消消暑商店中新到 n 支雪糕用长度为 n 的数组 costs 表示雪糕的定价其中 costs i 表示第 i 支雪糕的现金价格 Tony 一共有 coins 现金可以用于消费他想要买尽可能多的
pyspark指定schema

通过StructType对象指定DataFrame的Schema 没有嵌套结构的json jsonString id 01001 city AGAWAM pop 15338 state MA id 01002 city CUSHMAN po
r语言 col_co，cob，col，con，cor，cog前缀其实都是com变化而已

c开头前缀有co cob col com con cor cog等哪它们有什么关联呢下面我们来分析 come 英 k m 美 k m v 来来到到达 com前缀可以看成come变化而成全部来到就是聚集到一起表聚集加强强调的
select函数使用浅析

一函数原型及参数说明 int select int maxfdp fd set readfds fd set writefds fd set errorfds struct timeval timeout 返回值负值 select错误
VIM-Plug安装插件时，频繁更新失败，或报端口443被拒绝

安装vim插件 tabular时候一直报错尝试了网上大部分办法全部失败方法直接按照报错的内容自己手动操作错误如下图第一步去github检查插件的网址有没有问题直接复制网址浏览器搜索若长时间加载不上使用科学上网第二步若
重写equals方法

重写equals方法相信在每个人都有过重写过java的equals的方法的经历这篇博文就从以下几个方面说明重写equals方法的原由与君共进步一为什么要重写equals方法首先我们了解equals方法的作用是什么 java的官方
[论文笔记] GENDA: A Graph Embedded Network Based Detection Approach on encryption algorithm

GENDA A Graph Embedded Network Based Detection Approach on encryption algorithm of binary program JISA 2022 Xiao Li Scho
关闭apache-httpClient日志遇到的坑

log4j logger org OFF log4j logger httpclient OFF 看org apache commons httpclient Wire源码才知道他没有遵循类名 httpclient wire public
requests、aiohttp、httpx性能大比拼

在Python中有许多用于发送HTTP请求的库其中最受欢迎的是requests aiohttp和httpx 这三个库的性能和功能各不相同因此在选择使用哪个库时需要考虑到自己的需求和应用场景首先让我们来了解一下这三个库的基本介绍
科技，让二次元老婆动起来

想让你的二次元老婆动起来吗前不久 Meta 也就是Facebook 发布了一款有趣的AI工具Animated Drawings 它可以让静态的儿童画动起来有些懂行的朋友一看就说哎呀这不就是关键点检测再加动态化嘛道理是这个道理但是儿

科技，让二次元老婆动起来

科技，让二次元老婆动起来 的相关文章

随机推荐

热门标签

科技，让二次元老婆动起来的相关文章