关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4565人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗:武装力量已"装满弹匣" 不会因特朗普言论而退缩

国是直通车 浏览 24407

学生喊"包的" 语文老师抵制网络烂梗发起"语言保卫战"

封面新闻 浏览 32319

频曝食安问题、高管IPO前套现1.3亿!鸣鸣很忙上市太急?

互联网那些事 浏览 3513

美国为何长期觊觎委石油 委专家:对美具有互补性

海外网 浏览 3683

重庆女孩不会杀猪上千网友驱车帮忙 有人白送9头活猪

极目新闻 浏览 13409

不务正业? 理想汽车发布AI眼镜 长续航还能控车

网易汽车 浏览 3857

这件衣服太美了!今年流行的风格都离不开它

LinkFashion 浏览 145

具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地|36氪首发

36氪 浏览 3939

今年冬天流行的“露袜”穿法,时髦又减龄!

LinkFashion 浏览 3856

最高预增超32倍 283只医药股“剧透”业绩

北京商报 浏览 3427

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者 浏览 3348

侯晓楠喊出积极拥抱IP,但阅文很难成为下一个泡泡玛特

蓝鲸新闻 浏览 5172

小米成立新公司,要造电池?

电动知家 浏览 1316

长春亚泰热身1比0击败定南赣联 球队结构逐步成型

体坛周报 浏览 3408

英法空袭叙利亚中部地区 宣称打击极端组织"伊斯兰国"

环球网资讯 浏览 3521

福建舰更多细节公布 一组动图全方位看清楚

央视新闻客户端 浏览 3383

年内首家省级农商行挂牌不到20天,快马加鞭启动第二批机构合并

湘财Plus 浏览 2010

陶虹与朋友相聚,17岁女儿五官与神态似徐峥

黔乡小姊妹 浏览 3863

梅西世界杯戴帽超C罗!历史射手王不是他的极限:能不能再进11球

念洲 浏览 181

央视主持人海霞因争议遭除名,引发主持界讨论

史鹷的生活科普 浏览 3428

梅州众将:不管未来怎样都要打好最后一场,拼出个保级机会

懂球帝 浏览 4237
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1