starrainbow 2018-11-16
点击上方关注,All in AI中国
计算机图形学不仅具有惊人的视觉效果,它也为我们提供了重建不同领域的物理世界的工具,例如工业或医学应用。
这一领域的图形图灵测试在很久以前就已经通过了,因为目前的摄影和电影发展证明了这一点。如今,现实和幻想几乎无法区分,动画设计师可以在几天内创建逼真的世界。
图形图灵测试的定义:主题视图并与真实或计算机生成的场景交互。如果测试对象不能比随机猜测更好地从模拟现实中确定现实,则测试通过。
人工智能的最新进展可以帮助我们解决这个问题。伊恩·古德费罗(Ian Goodfellow)几年前介绍了一种称为生成对抗网络(GAN)的新型神经网络架构,能够突破计算机图形学的可能范围。这些应用程序是无止境的,但正如漫威之父斯坦·李(Stan Lee)教导我们的那样,"强大的权力带来巨大的责任"。事实上,如果没有适当的控制,生成与现实无法区分的图像和视频可能对我们的社会构成真正的威胁。在此观看由人工智能生成的假冒奥巴马的视频,就可以了解我的意思。
假冒奥巴马生成的对抗性网络
https://www.youtube.com/watch?v=AmUC4m6w1wo&t=2s
第一个挑战:流体模拟的人工智能领域
模拟流体的动力学一直是一个巨大的数学挑战。最先进的技术需要大量的计算能力,甚至更多的实时模拟。首先,重要的是流体这个术语包括液体、气体、等离子体、烟、风、水、火等流体的一些例子。
如果你熟悉计算流体动力学(CFD),你可能会了解Navier-Stokes方程。这些偏微分方程涉及移动流体的速度、压力、温度和密度,扩展了之前引入粘度影响的简单模型。我们不打算在此描述它们,因为它们非常复杂,如果没有适当的流体力学背景是很难理解的,但如果你对它们感兴趣,你可以查看文章末尾的链接。
找到这些方程的解并不适合有两个原因:它们是依赖于数据的,因此方法被截断以适应计算预算,并且可能表现出非常慢的渐近收敛性。
为了解决这些问题,机器学习最近引入了一种将流体动力学环境建模为监督回归问题的新方法。神经网络和回归森林给出了良好的结果,但它们需要由精确求解器提供的解决方案的数据集。这在模拟测试期间是不可能的,因为初始帧是由模型本身生成的(这不是精确求解器)。其结果并不完善,该模型的应用受到限制。
描述物理世界的一种新的令人兴奋的方法涉及直觉或朴素物理学的概念。人工智能的这一新领域涉及基于经验预测涉及宏观物体的物理相互作用的结果的能力。让我们看一个例子:例如婴儿不知道什么是重力,但通过实践经验,他们了解了它的概念。我们的想法是创建能够模拟直观物理的人工神经模型。Tompson等人开展这样的工作。他开发了一种新颖的、量身定制的ConvNet架构来取代现有的基于欧拉(Eulerian)方法的解算器,并引入了新的训练损失,保证了更快的收敛。
第二个挑战:非线性软组织动力学:模拟皮肤
获得逼真的人体建模是计算机图形学的主要目标之一。身体表面需要自然变形。在实时应用中,身体由骨骼运动控制。出于这个原因,身体表面与其骨架姿势相关联,并且皮肤的动画是它的函数。这是如何实现的?
最常见的算法是线性混合蒙皮(LBS),Unity和Unreal也在使用它。它不是计算密集型的,并且在大多数情况下都能提供良好的结果。不过还有一些缺点,其主要问题是在关节旋转过程中会出现强烈弯曲或不切实际的体积。
第二个重要策略是数据驱动的身体模型。该模型区区分了姿势和形状的参数,并允许更加深入地控制身体。这里的主要问题是缺乏对非线性动力学的控制。这对非线性动力学意味着什么?软组织(如人的腹部)不会以线性方式对力作出反应。它会反弹、旋转、摇晃,但非线性模型无法正确描述这些运动。
为了解决这个问题,引入了数据驱动的动力学模型。这些算法通常用于面部运动或布料动态。 Casas和Otaduy最近应用了最后一个类别的一个非常有趣的应用(最后的论文链接)。他们成功开发了一种数据驱动模型,用于模拟用公开可用的骨骼运动数据训练的非线性软组织动力学。作为每个机器学习模型,这种新颖的方法也无法正确描述远离训练集的变形。在必要时,克服这种限制的唯一方法是采用基于物理的身体模型。这些模型非常精确,但却复杂得多。
第三个挑战:计算机图形学中的布料模拟
第三个巨大的挑战是布料的模拟。布料模拟方法需要复杂的实验设置来获得物理性质。再现布料的正确行为可能非常复杂,研究人员正在应用机器学习方法来重建它的动态。了解布料的属性,不仅仅在动画中找到它的应用,而且在完全不同的领域也找到它的应用。让我们考虑一下服装的虚拟试穿系统:捕捉这种材料的动态可以开启电子商务中提供的新的广泛服务。如果我们考虑虚拟现实的进步尤其如此,这将带来更真实的虚拟购物,让我们可以虚拟地试穿衣物。
目前,以多种方式检索动态系统的物理属性。最直接的方法是通过测量、采样物理量和估计相关属性。第二个重要策略是模拟、优化和迭代动态系统,逐步提取更接近实际值的特征。
结论
我们在计算机图形学中了解了人工智能面临的三个挑战。在物理世界的再现中,这三个类别是混合的:想像一面被风吹动的旗帜的例子,在这种情况下,所有三个概念都出现在这个事件中。
作者:Mauro Comi
文章来源:https://towardsdatascience.com/3-challenges