关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3673人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美媒刊文:不要虚张声势了 放弃"战胜中国"的想法吧

环球时报国际 浏览 13641

辽宁U18男足点球5-4战胜山东U18男足,夺得全运会冠军

懂球帝 浏览 3443

埃迪-豪面对前东家伯恩茅斯7场不胜,并列英超主帅最长不胜纪录

直播吧 浏览 4315

对话亿纬锂能陈翔:AI的尽头是能源,算力驱动储能增长

贝壳财经 浏览 1045

伊朗军队总司令:“我们的手始终放在扳机上”

环球网资讯 浏览 2359

豪华5座中大型SUV!续航2327km,瞄准理想L6

隔壁说车老王 浏览 3438

比小说更魔幻!前华人首富,为何被特朗普特赦

说财猫 浏览 3693

中国世界领先装备“暴款”,打破“两党共识”

浏览 26882

年薪超百万,京东开始挖汽车人!

电动知家 浏览 3626

委内瑞拉强烈反对“美国封锁空域”

国际在线 浏览 3206

邓炳强称火势蔓延过快不寻常 事发楼栋居民发声

经济观察报 浏览 32145

推广中奖名单-更新至2025年9月30日推广

黎贝卡的异想世界 浏览 3681

2025 全球十大工程成就发布:DeepSeek、人形机器人等入选

IT之家 浏览 3922

华为广汽新车明年6月上!任正非建议品牌名,徐直军参与造型评审

车东西 浏览 3178

周深:新年巡演审批通过,创下三大历史记录

陈意小可爱 浏览 2467

梅西:作为朋友我当然希望内马尔踢世界杯,但我无法客观评价

懂球帝 浏览 214

宝藏BOSS冯擎峰:是CTO,也是CEO

网易汽车 浏览 3429

台湾教授苑举正痛心疾首:赖清德称"终战"是愚不可及

大象新闻 浏览 9066

29岁国乒老将临危受命?淘汰黄友政状态回暖 锁世界杯后冲世乒赛

颜小白的篮球梦 浏览 1820

泰军警告柬方:若敢用中国战略武器 将直接纵深打击

时时有聊 浏览 19635

特拉维夫多处建筑遭袭 相关区域实施严格管制

环球网资讯 浏览 1895
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1