狠狠躁夜夜躁人人爽超碰97香蕉|色婷婷日日躁夜夜躁|亚洲一区欧美一区在线播|久久久久久性高|伊人久久大香线蕉亚洲

歡迎來到同城快修-附近家電維修、家電清洗、家電安裝服務(wù)平臺

24小時家電維修熱線:

400—1558638

當(dāng)前位置:主頁 > 油煙機(jī) > 維修資訊 >

清華大學(xué)研發(fā)LLM4VG基準(zhǔn):用于評估LLM視頻時序定位性能

發(fā)布日期:2023-12-29 21:41:47 瀏覽:
清華大學(xué)研發(fā)LLM4VG基準(zhǔn):用于評估LLM視頻時序定位性能

IT之家 12 月 29 日消息,大語言模型(LLM)的觸角已經(jīng)從單純的自然語言處理,擴(kuò)展到文本、音頻、視頻等多模態(tài)領(lǐng)域,而其中一項(xiàng)關(guān)鍵就是視頻時序定位(Video Grounding,VG)。

VG 任務(wù)的目的基于給定查詢(一句描述),然后在目標(biāo)視頻段中定位起始和結(jié)束時間,核心挑戰(zhàn)在于時間邊界定位的精度。

清華大學(xué)研究團(tuán)隊(duì)近日推出了“LLM4VG”基準(zhǔn),這是一個專門設(shè)計(jì)用于評估 LLM 在 VG 任務(wù)中的性能。

此基準(zhǔn)考慮了兩種主要策略:第一種涉及直接在文本視頻數(shù)據(jù)集(VidLLM)上訓(xùn)練的視頻 LLM,第二種是結(jié)合傳統(tǒng)的 LLM 與預(yù)訓(xùn)練的視覺模型。

在第一種策略中,VidLLM 直接處理視頻內(nèi)容和 VG 任務(wù)指令,根據(jù)其對文本-視頻的訓(xùn)練輸出預(yù)測。

第二種策略更為復(fù)雜,涉及 LLM 和視覺描述模型。這些模型生成與 VG 任務(wù)指令集成的視頻內(nèi)容的文本描述,通過精心設(shè)計(jì)的提示。

這些提示經(jīng)過專門設(shè)計(jì),可以有效地將 VG 的指令與給定的視覺描述結(jié)合起來,從而讓 LLM 能夠處理和理解有關(guān)任務(wù)的視頻內(nèi)容。

據(jù)觀察,VidLLM 盡管直接在視頻內(nèi)容上進(jìn)行訓(xùn)練,但在實(shí)現(xiàn)令人滿意的 VG 性能方面仍然存在很大差距。這一發(fā)現(xiàn)強(qiáng)調(diào)了在訓(xùn)練中納入更多與時間相關(guān)的視頻任務(wù)以提高性能的必要性。

而第二種策略優(yōu)于 VidLLM,為未來的研究指明了一個有希望的方向。該策略主要限制于視覺模型的局限性和提示詞的設(shè)計(jì),因此能夠生成詳細(xì)且準(zhǔn)確的視頻描述后,更精細(xì)的圖形模型可以大幅提高 LLM 的 VG 性能。

總之,該研究對 LLM 在 VG 任務(wù)中的應(yīng)用進(jìn)行了開創(chuàng)性的評估,強(qiáng)調(diào)了在模型訓(xùn)練和提示設(shè)計(jì)中需要更復(fù)雜的方法。

IT之家附上論文參考地址:https://arxiv.org/pdf/2312.14206.pdf

主站蜘蛛池模板: 国产又大又黑又粗免费视频 | 久久久噜噜噜久久| 中文字幕日韩精品美一区二区三区| 日本黄网站三级三级三级| 精品偷拍一区二区三区在线看| 无码人妻一区二区三区免费看| 欧美系列在线一区二区| 国产精品女人一区二区三区| 国产精品老熟女露脸视频| 无码av不卡免费播放| 男人的天堂一区二区三区精选av| 欧美日韩国产一区二区三区在线| 欧洲熟妇色xxxx欧美老妇免费| 成人国内精品久久久久影院vr| 性无码免费一区二区三区在线| 精品精品国产欧美在线| 日本xxxx色视频在线观看| 五十路熟妇无码专区| 国产美女被遭强高潮免费网站| 亚洲精品一区二区国产精华液| 国产精品亚洲lv粉色| 国产亚洲香蕉线播放αv38| 亚洲成人一区二区三区h| 亚洲伊人久久精品酒店| 久久久精品波多野结衣| 国产乱子一区二区| 亚洲成a人片在线观看天堂无码不卡| 97超级碰碰人妻中文字幕| 亚洲中文久久精品无码99| 欧美人与动牲交a欧美| 亚洲国产区男人本色| 在线永久免费观看黄网站| 日韩精品一区二区在线观看| 国产精品边做奶水狂喷| 51国产偷自视频区视频| 亚洲国产aⅴ成人精品无吗| 亚洲热线99精品视频| 东京热人妻中文无码av| 少妇一区二区三区免费视频| 无码日韩精品一区二区免费暖暖| 国产精品久久久久久麻豆一区|