11月28日下午,中國(guó)計(jì)算機(jī)學(xué)會(huì)計(jì)算機(jī)視覺(jué)專(zhuān)委會(huì)(CCF-CV)走進(jìn)高校系列報(bào)告會(huì)第95期活動(dòng)—“計(jì)算機(jī)視覺(jué)前沿技術(shù)及應(yīng)用”在濟(jì)南大學(xué)第一報(bào)告廳舉行。本期報(bào)告會(huì)邀請(qǐng)了北京大學(xué)田永鴻教授,電子科技大學(xué)王正寧副教授,中國(guó)科學(xué)院信息工程研究所葛仕明研究員和南京理工大學(xué)的張姍姍教授等四位專(zhuān)家做特邀報(bào)告,濟(jì)南大學(xué)張勇副校長(zhǎng)參加活動(dòng)并致辭。信息科學(xué)與工程學(xué)院彭京亮教授擔(dān)任本次報(bào)告會(huì)的執(zhí)行主席。報(bào)告會(huì)上,專(zhuān)家們圍繞“計(jì)算機(jī)視覺(jué)前沿及應(yīng)用”做了精彩報(bào)告。
張勇副校長(zhǎng)對(duì)四位報(bào)告嘉賓的到來(lái)表示歡迎和感謝,向大家介紹了濟(jì)南大學(xué)計(jì)算機(jī)學(xué)科發(fā)展和人才培養(yǎng)計(jì)劃,希望以此為契機(jī)進(jìn)一步促進(jìn)濟(jì)南大學(xué)信息科學(xué)與工程學(xué)院在計(jì)算機(jī)視覺(jué)領(lǐng)域的學(xué)術(shù)交流,爭(zhēng)取進(jìn)行更深層次的合作,為計(jì)算機(jī)視覺(jué)領(lǐng)域的發(fā)展貢獻(xiàn)力量。
北京大學(xué)田永鴻教授的報(bào)告題目是:“Neuromorphic vision drives new AI: A novel paradigm for computing vision”,指出目前傳統(tǒng)的計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)結(jié)合的模式需要做出改變,列出了基于框架的深度學(xué)習(xí)表示方法,啟發(fā)大家重新思考現(xiàn)在長(zhǎng)期使用的計(jì)算機(jī)視覺(jué)以追求創(chuàng)新;其次,參考了視覺(jué)信息是視網(wǎng)膜系統(tǒng)上的工作原理,提出了嘗試使用深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)模擬人的視覺(jué)系統(tǒng)。接下來(lái)先是回顧了神經(jīng)形態(tài)視覺(jué)的相關(guān)工作,隨后介紹了目前正在進(jìn)行的高速識(shí)別系統(tǒng),高速運(yùn)動(dòng)對(duì)象通過(guò)特定的相機(jī)所生成的脈沖流輸入到簡(jiǎn)單的模型進(jìn)行識(shí)別的工作。最后,報(bào)告指出脈沖神經(jīng)網(wǎng)絡(luò)對(duì)于復(fù)雜視覺(jué)提供了新的思路并指出了當(dāng)前所需要的顛覆性思維帶來(lái)的挑戰(zhàn)與機(jī)遇。
電子科技大學(xué)王正寧副教授的報(bào)告題目是“基于稀疏體素注意力網(wǎng)絡(luò)的三維目標(biāo)檢測(cè)方法”,指出激光雷達(dá)在自動(dòng)駕駛領(lǐng)域的應(yīng)用,越來(lái)越多的研究者關(guān)注基于點(diǎn)云的三維目標(biāo)檢測(cè),介紹了幾種典型的3D探測(cè)方法以及KITTY數(shù)據(jù)集。其次,詳細(xì)介紹了SVGA-Net的技術(shù)路線(xiàn),用每個(gè)體素內(nèi)的局部完全圖和所有體素的全局KNN圖來(lái)學(xué)習(xí)判別特征,再通過(guò)注意力機(jī)制使得局部和全局特征結(jié)合,在3D探測(cè)數(shù)據(jù)集KITTY上取得了較好的三維目標(biāo)檢測(cè)結(jié)果,并將把該方法應(yīng)用到Waymo數(shù)據(jù)集上來(lái)測(cè)試改進(jìn)。
中國(guó)科學(xué)院信息工程研究所葛仕明研究員的報(bào)告題目是“低質(zhì)量視覺(jué)物體學(xué)習(xí)理解”,指出雖然在深度學(xué)習(xí)在視覺(jué)整理、深度網(wǎng)絡(luò)上、性能上進(jìn)展顯著,但是因?yàn)楦鞣N原因出現(xiàn)了在實(shí)際場(chǎng)景中難以獲得海量高質(zhì)的數(shù)據(jù)的難題。為了解決這一個(gè)問(wèn)題,通過(guò)復(fù)用深度模型以及對(duì)于求解知識(shí)表達(dá)、蒸餾、修復(fù)和遷移難題的思考,提出了跨質(zhì)量知識(shí)蒸餾框架和系列算法,可以應(yīng)用于多種場(chǎng)景。隨后分別以蒙面人臉檢測(cè)識(shí)別、低分辨率人臉識(shí)別以及弱小目標(biāo)識(shí)別為例,介紹了在圖像精度不足的數(shù)據(jù)集中,通過(guò)深度模型的蒸餾優(yōu)化來(lái)達(dá)到,最后討論了未來(lái)可能的發(fā)展方向—低質(zhì)量數(shù)據(jù)解析與學(xué)習(xí)。
南京理工大學(xué)張姍姍教授的報(bào)告題目是“眾里尋他千百度”:基于視覺(jué)的人體檢測(cè)與搜尋,指出在自動(dòng)駕駛、視頻監(jiān)控、智能機(jī)器人等諸多領(lǐng)域中,一方面在復(fù)雜多變的實(shí)際場(chǎng)景下對(duì)于行人檢測(cè)存在著遮擋、域間差異、光照等問(wèn)題。提出了遮擋模式建模以及動(dòng)態(tài)表示的辦法來(lái)解決遮擋問(wèn)題;為了提高模型的泛化能力,強(qiáng)調(diào)數(shù)據(jù)集的多樣性;在夜間照明情況相對(duì)較差時(shí),使用特征注意力機(jī)制和特征轉(zhuǎn)換的策略來(lái)進(jìn)行行人檢測(cè);在能見(jiàn)度相對(duì)較低的情況下比如有霧的情況下,提出了Image dehazing network并設(shè)置霧密度分類(lèi)器和多域檢測(cè)器來(lái)進(jìn)行朦朧的行人檢測(cè)。另一方面,對(duì)于行人搜索領(lǐng)域,介紹了聯(lián)合行人檢測(cè)和重新識(shí)別的方法、Two-stage methods和One-stage methods,多任務(wù)聯(lián)合方法通常比Two-stage methods更加有效。最后提出了對(duì)于未來(lái)工作對(duì)于遮擋、視角變換所帶來(lái)的挑戰(zhàn)。
此次CCF-CV走進(jìn)高校系列報(bào)告會(huì)講解深入淺出,報(bào)告內(nèi)容精彩。報(bào)告會(huì)現(xiàn)場(chǎng)氣氛熱烈,在場(chǎng)的師生們就專(zhuān)家的報(bào)告紛紛提出自己感興趣的問(wèn)題,現(xiàn)場(chǎng)專(zhuān)家給出了詳盡的解答。最后,濟(jì)南大學(xué)彭京亮教授進(jìn)行活動(dòng)總結(jié),以本次報(bào)告為契機(jī),希望更多的專(zhuān)家學(xué)者關(guān)注濟(jì)南大學(xué)計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,共同努力推動(dòng)計(jì)算機(jī)視覺(jué)的研究和應(yīng)用。
撰稿:王豪 編輯:張偉 編審:賈海寧