上海热线 新闻   国内新闻   国际新闻 教育   留资讯学   教育资讯 生活   旅游资讯   汽资讯车 娱乐   娱乐资讯   荧屏资讯
财经   财经要闻   楼市快讯 健康   时尚健康   健康资讯 时尚   完美护肤   整形新闻 科技   互 联 网   科技资讯
首页 >> 新闻 >> 科技 >> 家电行情 >> 正文
  • 想象力惊人!只凭一句话,AI就能脑补出动漫小片

  • 时间:2018-04-16 新闻来源: 北京之窗

      《摩登原始人》你看过么?

      这是一道暴露年龄题。

      安妮薇,《摩登原始人》是一部首播于1960年的喜剧动画片。第一季在豆瓣上被2.2万用户打出8.7分的评价。

      现在,这部想象力爆棚的动画片,被用来训练出了一个想象力惊人的AI。有多惊人?看过的人都说鹅妹子嘤~

      只需要给一段脚本,或者说文本描述,AI就能脑补生成一段动漫小片。注意!这些动漫小片,都是你没有看过的全新版本。

      生成的方法,就是AI根据描述,从原始动画片中找到对应的元素,提取出来。然后再调整大小、比例、位置、角度、道具、前景、背景等,重新拼接在一起~

      来,直接看展示。

      交代一下,Fred、Wilma等都是这部动漫的主人公名字。

      脚本:

      Fred戴着一顶红帽子,正走在客厅里。

      这是AI生成的视频:

      

      脚本:

      Betty和Wilma在客厅里聊天。她俩坐在沙发上,你一言我一语。

      视频:

      

      脚本:

      Fred开车途中,一边想一边自言自语。

      视频:

      

      脚本:

      Betty在厨房里打电话。

      视频:

      

      怎么样?是不是很厉害?

      下面这段视频,有更多的集中展示。

       

      数据集和模型

      AI是怎么做到的呢?简单来说,首先得构建一个《摩登原始人》的数据集,这个数据集包括25000个动画片小段(75帧,约三秒)。

      每一小段都经过了密集的标注。

      标注信息包括,场景、主要角色的名称:Fred、Wilma等。对于不常出现的配角,会有人工添加简单的注释:警察、穿红衣的老头等。

      然后,还要借助SLIC算法(Simple Linear Iterative Clustering) 、GrabCut自动图像分割算法、PatchMatch算法等对画面进行分割和重建。

      

      经过这一系列的处理,就构成了AI可以利用的原始素材。

      当然重中之重,就是AI模型的构建。

      这个模型被称为Craft(Composition, Retrieval and Fusion Network)。从结构上来说,这个模型长这样:

      

      主要包括三个部分:Layout Composer(布局编排器)、Entity Retriever(实体检索器)、Background Retriever(背景检索器)。

      在“脑补”动漫小片时,Craft从空视频开始,根据脚本描述,依次添加场景中的实体。实体和背景检索器,会从数据集中搜索合适的素材,而布局编排器会对位置和比例进行调整。

      最终上述种种融合,生成一段全新的小片。

      

      上面这张图,就是布局编排器的工作原理。

      当然这中间还涉及很多数学公式啊,实验啊什么的。如果你对这些细节感兴趣,可以直接前往论文查看。

      地址:https://arxiv.org/abs/1804.03608

      这个研究,出自AI2、UIUC等机构的几名学者之手。

      还不完美

      当然,当然,现阶段,这个研究远非无懈可击。

      比方,画面的重建还相对粗糙,能明显看出拼贴的痕迹。

      还有,AI有时会在理解脚本和重建视频上产生问题。

      例如,搞错姿势(站着->坐着)、打电话时听筒位置不对、背景和人物动作不同步等等。还有下面这个案例。

      脚本:Wilma正跟Fred讲话,而他坐在饭厅的餐桌前读书。Fred专注读书,没听Wilma在讲什么。

      

      如果你仔细看,能发现两个人物关系搞反了。

      还有更糟的。

      对于极端复杂的场景,例如包括三个或以上罕见的实体对象,Craft脑补出来的动漫小骗堪称“灾难”。

      就像这样。

      

      不过,这个研究的意义在于,AI对于文本的理解,以及基于其上的视频生成。一切还都有进步空间。

      更远一点,也许未来的动画工作室,不会再有一堆堆天才的动画师,取而代之的是能快速生成动画片的AI。

网站首页 | 关于我们 | 联系方式 | 招聘信息 | 版权声明 | 网站地图 | 北京之窗
地址:朝阳区建国路88号 投稿QQ:2282136077 投稿邮箱2282136077@qq.com
Copyright © 2010 www.jingzc.com Inc. All Rights Reserved. 北京之窗 版权所有