關(guān)于我們
書單推薦
新書推薦

視覺語言交互中的視覺推理研究

視覺語言交互中的視覺推理研究

定  價(jià):49 元

叢書名:CCF優(yōu)博叢書

        

  • 作者:牛玉磊著
  • 出版時(shí)間:2023/3/1
  • ISBN:9787111723035
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP302.7 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:32開
9
7
7
8
2
7
3
1
0
1
3
1
5
《視覺語言交互中的視覺推理研究》的作者牛玉磊博士于2020年在中國人民大學(xué)取得博士學(xué)會(huì),后前往美國哥倫比亞大學(xué)開展博士后研究工作。本書從知識(shí)建模和知識(shí)推斷兩方面入手,深入研究了視覺語言交互任務(wù)中的視覺推理問題。

《視覺語言交互中的視覺推理研究》共五章:
第1章主要介紹了計(jì)算機(jī)視覺與自然語言處理交叉領(lǐng)域中交互類問題的研究背景,并分別從單輪交互、多輪交互、知識(shí)偏差三個(gè)角度選取了指稱語理解、視覺對(duì)話、視覺問答三個(gè)經(jīng)典任務(wù)展開討論。
第2章主要介紹了單輪交互情形的代表性視覺推理任務(wù),即指稱語理解問題,提出了變分背景框架,根據(jù)視覺圖像和指稱語文本的聯(lián)系及視覺物體之間的關(guān)系提取語義背景信息,并根據(jù)背景信息對(duì)指稱語進(jìn)行定位。
第3章介紹了多輪交互情形的代表性視覺推理任務(wù),即視覺對(duì)話問題,提出了遞歸注意力機(jī)制,通過視覺指代消解的思想對(duì)圖像、對(duì)話和問題之間的聯(lián)系進(jìn)行建模,優(yōu)化視覺表示。
第4章介紹了知識(shí)偏差情形的代表性視覺推理任務(wù),即視覺問答問題,基于因果推理提出了反事實(shí)視覺問答框架,在訓(xùn)練環(huán)境和測(cè)試環(huán)境的答案分布不一致情況下,通過因果效應(yīng)的視角提取并去除語言偏差。
第5章對(duì)本書進(jìn)行了總結(jié),并對(duì)未來研究方向進(jìn)行了展望。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容