关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3531人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全运会女足综述:王霜制胜湖北2-1进4强 张琳艳世界波北京1-3上海

我爱英超 浏览 4414

芒米Pocket Max掌机:模块化设计、大容量电池与强芯片的结合

IT之家 浏览 3554

梦天家居紧急刹车

富凯财经 浏览 3482

动力新提升 全新方程豹钛3将于上半年上市

车质网 浏览 3523

特朗普:内塔尼亚胡执政前景“存在不确定性”

环球网资讯 浏览 4724

陈涛:我们最后四轮赛程可以用地狱级来形容,已经没有退路了

懂球帝 浏览 4664

沃尔沃汽车2月至4月全球销量同比下滑10%

盖世汽车 浏览 1288

特朗普回应小学遇袭 暗示伊朗也可能有"战斧"巡航导弹

北京日报客户端-长安街知事 浏览 32570

赚了钱,反而有人说小鹏不是“小鹏”了?

速度计 浏览 3890

给《树影迷宫》演技最好的7位演员排座次:刘琳第3,第1无法超越

娱乐圈笔娱君 浏览 4280

长安银行“踩油门”

北京商报 浏览 3492

苏亚雷斯:保级信心主要来自我的球员,包括逆境中展现的决心

懂球帝 浏览 4640

苹果发布 iPhone 17e 搭载 A19 芯片 4499 元起售

威锋网 浏览 2825

索尼耳夹式LinkBuds Clip耳机曝光:4种颜色、续航37小时

IT之家 浏览 3569

30年来首次!美国法院系统也被卷入停摆 业内预计政府关门将“史上最长”

财联社 浏览 4641

尤文旧将阿莫鲁索:不能让伊尔迪兹独自承担赢球责任

懂球帝 浏览 5160

售出39000台 小米汽车公布2026年1月销量

网易汽车 浏览 3412

宗馥莉辞职内幕曝光,大女主的复仇之路,如何伤了娃哈哈?

北向财经 浏览 4516

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 4505

81岁冯淬帆去世,曾悼念许绍雄时自曝已病入膏肓,苟延残喘的活着

扒虾侃娱 浏览 4297

大礼包?蓉城海港送对手亚冠首胜!上海双雄成唯二0胜队+包揽倒2

我爱英超 浏览 4654
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1