人工智能(AI)制备的三维物体模型看上去并不可笑。在蒙特利尔的NeurIPS2018会议上的论文中,麻省理工学院计算机科学与人工智能实验室(MITCSAIL)和谷歌的研究人员叙述了一个分解的AI系统需要用细致的纹理建构令人信服的形状。
人工智能系统视觉对象网络(VON)不仅可以分解比某些最先进设备的方法更加细致的图像,还可以展开形状和纹理编辑,视点位移以及其他三维调整。“现代深层分解模型学会制备细致的图像,”研究人员写到。“大多数计算出来模型只专心于分解2D图像,忽视了世界的3D性质,这种仅有2D的视角不可避免地容许了它们在许多领域的实际应用于,例如制备数据分解,机器人自学,视觉现实和游戏行业。
”VON通过牵头制备三维形状和二维图像来解决问题这个问题,研究人员将其称作“找出对象回应”。图像分解模型被分解成为三个因素:形状,视点和纹理,首先自学在计算出来“2.5D”草图和加到纹理之前制备三维形状。
最重要的是,因为这三个因素是条件独立国家的,所以模型不必须二维和三维形状之间的筛选数据。这使得团队需要在大规模的二维图像和三维形状子集上展开训练,如Pix3D,Google图像搜寻和ShapeNet,后者包括55个对象类别的数千个CAD模型。为了让VON自学如何分解自己的形状,该团队训练了一个分解对付网络(GAN),一个由分解样本和鉴别器构成的生成器构成的两部分神经网络,企图区分分解的样本和现实世界样本,在上述三维形状数据集上。
纹理分解被降级到另一个基于GAN的神经网络。
本文来源:中欧体育·(中国)zoty-www.mysi-c.com