摘要:隨著信息化建設(shè)的加快,圖像和視頻數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng)。卷積神經(jīng)網(wǎng)絡(luò)的不斷更新優(yōu)化使得行為識(shí)別研究取得了較大的進(jìn)展。因此,我們需要在真實(shí)的復(fù)雜環(huán)境中實(shí)現(xiàn)行人檢測(cè)并識(shí)別行為類別,這是一個(gè)值得探索和討論的話題。本文提出了一種新的模型,基于 ResNeXt 模型并設(shè)置多尺度特征提取單元的殘差神經(jīng)網(wǎng)絡(luò),能充分挖掘輸入的特征信息,豐富特征維度,解決特征信息尺度單一的問(wèn)題。為了驗(yàn)證我們改進(jìn)的算法性能,我們進(jìn)行了多組識(shí)別場(chǎng)景的測(cè)試,其中包括UT-interaction數(shù)據(jù)集、UCF11數(shù)據(jù)集、UCF101數(shù)據(jù)集和CAVIAR數(shù)據(jù)集。我們的模型在以上數(shù)據(jù)集上的識(shí)別準(zhǔn)確率分別達(dá)到了99.9%、99.5%、97.3%和100%。根據(jù)結(jié)果顯示,我們的模型在各項(xiàng)識(shí)別任務(wù)中均表現(xiàn)出了較高的水平,證明了模型的卓越性能。

