在信息爆炸的時代,圖像和視頻壓縮技術成爲了現代社會研究的一大熱門。如何用更少的資源傳輸更高質量的圖像和視頻,一直是科研事情者們追求的目標。人文交流月期間,信息與通信工程學院邀請到了北京航空航天大學的傑出教授李勝曦,爲同學們帶來了一場關于《面向語義壓縮的生成對抗網絡與可逆化模型》的專題講座。
李教授首先爲同學們介紹了圖像/視頻壓縮的研究配景。他強調,隨著數字媒體的快速發展,人們對圖像和視頻質量的要求越來越高,而傳統的壓縮要领已經難以滿足這種需求。因此,尋找新的壓縮技術成爲了行業發展的一定趨勢。

接著,李勝曦教授詳細介紹了面向視覺語義重構的表征技術。他分別介紹了信息重構、感知重構和語義重構這表征技術的發展階段。隨後,李教授介紹了語義空間的構建要领。指出現有的IPM-GAN模型在匹配複雜數據漫衍時仍存在缺陷。爲了克服這一困境,人們提出了將生成模型的學習由矩匹配轉變爲特征函數匹配的創新思路。這一思路在理論上能夠更好地匹配複雜數據漫衍,提高生成圖像的質量。
最後,李教授還介紹了面向機器視覺的壓縮要领以及VCM標准框架。他提到了單輸入多輸出網絡(SIMO)的提案,這一方案爲檢測與支解任務提供了新思路,有望在未來推動機器視覺領域的發展。
講座中,同學們深刻感受到了李勝曦教授在語義壓縮與生成對抗網絡領域的深厚造詣和獨到見解,與李教授在語義壓縮方面的問題進行了熱烈討論。