关闭广告

牛津VGG团队突破：单一网络实现视频动态3D重建

科技行者3131人阅读

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

今年春夏一定要有“这件衣服”，高级又气质！

LinkFashion 浏览 1312

土拍市场延续“缩量提质”百强房企今年前两月拿地超950亿元

商业观察杂志社浏览 2538

鸿蒙版微信一周年：从“能用”到“好用” 超2000万下载量背后的进化史

快科技浏览 4261

精彩推荐

美乌4小时会谈细节披露特朗普发声

新华社浏览 3658

委内瑞拉外长：伊朗提出＂全方位＂合作共同应对美威胁

界面新闻浏览 3396

裤子+靴子：今年冬天最经典搭配，松弛又时髦！

LinkFashion 浏览 2955

上海百万平方米AI小镇全球亮相！20亿元创业基金虚位以待

上观新闻浏览 4977

苹果被曝开发类ChatGPT应用！专为训练新Siri打造

智东西浏览 4677

黄仁勋与李飞飞，让AI不止于“动嘴”

首席商业评论浏览 3269

解密福建舰电磁弹射背后的硬核支撑

上观新闻浏览 3876

推广 || 断舍离N次也不会断了它，买过最值的冬日单品之一

黎贝卡的异想世界浏览 4052

美媒：乌克兰向美国提交对最新“和平计划”的回复

澎湃新闻浏览 3481

红色通缉令下，戈恩从汽车领袖变身管理大师

帮宁工作室浏览 3438

四门四座焕新升级第五代宏光MINIEV内饰图曝光

网易汽车浏览 2552

综合补贴8.78万元起星光730尊享型正式上市

网易汽车浏览 1124

每月抽查5%商家外卖平台“新国标”落地

北京商报浏览 3621

何猷君法国婚礼高调奢华，奚梦瑶行头4500万

喜欢历史的阿繁浏览 94

全新一代问界M9上市，用140项技术创新回答何为“中国式豪华”

环球网资讯浏览 274

英法宣布牵头霍尔木兹海峡安全通航行动

澎湃新闻浏览 1339

特朗普：不想“浪费时间”与普京会晤

参考消息浏览 9438

特朗普还嘴硬：莫迪保证过不买俄罗斯石油了

澎湃新闻浏览 9281

燃油+电动全都配全新宝马4系最新消息曝光

乐选爱车浏览 2973

怒砸15亿，全明星阵容，年底压轴大片来了

独立鱼浏览 2770

演员吴慷仁回应立场问题，否认自己争议标签

阿废冷眼观察所浏览 929

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-1