91麻豆精品国产自产在线观看自慰,中文字幕人妻精品无码四区,456成人网

《視覺語言交互中的視覺推理研究》的作者牛玉磊博士于2020年在中國人民大學(xué)取得博士學(xué)會(huì)，后前往美國哥倫比亞大學(xué)開展博士后研究工作。本書從知識(shí)建模和知識(shí)推斷兩方面入手，深入研究了視覺語言交互任務(wù)中的視覺推理問題。

《視覺語言交互中的視覺推理研究》共五章：
第1章主要介紹了計(jì)算機(jī)視覺與自然語言處理交叉領(lǐng)域中交互類問題的研究背景，并分別從單輪交互、多輪交互、知識(shí)偏差三個(gè)角度選取了指稱語理解、視覺對(duì)話、視覺問答三個(gè)經(jīng)典任務(wù)展開討論。
第2章主要介紹了單輪交互情形的代表性視覺推理任務(wù)，即指稱語理解問題，提出了變分背景框架，根據(jù)視覺圖像和指稱語文本的聯(lián)系及視覺物體之間的關(guān)系提取語義背景信息，并根據(jù)背景信息對(duì)指稱語進(jìn)行定位。
第3章介紹了多輪交互情形的代表性視覺推理任務(wù)，即視覺對(duì)話問題，提出了遞歸注意力機(jī)制，通過視覺指代消解的思想對(duì)圖像、對(duì)話和問題之間的聯(lián)系進(jìn)行建模，優(yōu)化視覺表示。
第4章介紹了知識(shí)偏差情形的代表性視覺推理任務(wù)，即視覺問答問題，基于因果推理提出了反事實(shí)視覺問答框架，在訓(xùn)練環(huán)境和測(cè)試環(huán)境的答案分布不一致情況下，通過因果效應(yīng)的視角提取并去除語言偏差。
第5章對(duì)本書進(jìn)行了總結(jié)，并對(duì)未來研究方向進(jìn)行了展望。

你還可能感興趣

我要評(píng)論