911午夜福利精品,美国精品午夜剧场免费观看

深度強(qiáng)化學(xué)習(xí)結(jié)合深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)算法各自的優(yōu)勢(shì)解決復(fù)雜的決策任務(wù)。得益于 DeepMind AlphaGo 和 OpenAI Five 成功的案例，深度強(qiáng)化學(xué)習(xí)受到大量的關(guān)注，相關(guān)技術(shù)廣泛應(yīng)用于不同的領(lǐng)域。本書(shū)分為三大部分，覆蓋深度強(qiáng)化學(xué)習(xí)的全部?jī)?nèi)容。第一部分介紹深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的入門(mén)知識(shí)、一些非�；A(chǔ)的深度強(qiáng)化學(xué)習(xí)算法及其實(shí)現(xiàn)細(xì)節(jié)，包括第 1～6 章。第二部分是一些精選的深度強(qiáng)化學(xué)習(xí)研究題目，這些內(nèi)容對(duì)準(zhǔn)備開(kāi)展深度強(qiáng)化學(xué)習(xí)研究的讀者非常有用，包括第 7～12 章。第三部分提供了豐富的應(yīng)用案例，包括 AlphaZero、讓機(jī)器人學(xué)習(xí)跑步等，包括第 13～17 章。本書(shū)是為計(jì)算機(jī)科學(xué)專(zhuān)業(yè)背景、希望從零開(kāi)始學(xué)習(xí)深度強(qiáng)化學(xué)習(xí)并開(kāi)展研究課題和實(shí)踐項(xiàng)目的學(xué)生準(zhǔn)備的。本書(shū)也適合沒(méi)有很強(qiáng)的機(jī)器學(xué)習(xí)背景、但是希望快速學(xué)習(xí)深度強(qiáng)化學(xué)習(xí)并將其應(yīng)用到具體產(chǎn)品中的軟件工程師閱讀。

董　豪北京大學(xué)計(jì)算機(jī)系前沿計(jì)算研究中心助理教授、深圳鵬城實(shí)驗(yàn)室雙聘成員。于 2019 年秋獲得英國(guó)帝國(guó)理工學(xué)院博士學(xué)位。研究方向主要涉及計(jì)算機(jī)視覺(jué)和生成模型，目的是降低學(xué)習(xí)智能系統(tǒng)所需要的數(shù)據(jù)。致力于推廣人工智能技術(shù)，是深度學(xué)習(xí)開(kāi)源框架 TensorLayer 的創(chuàng)始人，此框架獲得 ACM MM 2017 年度最佳開(kāi)源軟件獎(jiǎng)。在英國(guó)帝國(guó)理工學(xué)院和英國(guó)中央蘭開(kāi)夏大學(xué)獲得一等研究生和一等本科學(xué)位。丁子涵英國(guó)帝國(guó)理工學(xué)院碩士。獲普林斯頓大學(xué)博士生全額獎(jiǎng)學(xué)金，曾在加拿大 Borealis AI、騰訊 Robotics X 實(shí)驗(yàn)室有過(guò)工作經(jīng)歷。本科就讀于中國(guó)科學(xué)技術(shù)大學(xué)，獲物理和計(jì)算機(jī)雙學(xué)位。研究方向主要涉及強(qiáng)化學(xué)習(xí)、機(jī)器人控制、計(jì)算機(jī)視覺(jué)等。在 ICRA、NeurIPS、AAAI、IJCAI、Physical Review 等頂級(jí)期刊與會(huì)議發(fā)表多篇論文，是 TensorLayer-RLzoo、TensorLet 和 Arena 開(kāi)源項(xiàng)目的貢獻(xiàn)者。仉尚航加州大學(xué)伯克利分校，BAIR 實(shí)驗(yàn)室（Berkeley AI Research Lab）博士后研究員。于 2018年獲得卡內(nèi)基·梅隆大學(xué)博士學(xué)位。研究方向主要涉及深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)及強(qiáng)化學(xué)習(xí)。在NeurIPS、CVPR、ICCV、TNNLS、AAAI、IJCAI 等人工智能頂級(jí)期刊和會(huì)議發(fā)表多篇論文。目前主要從事 Human-inspired sample-efficient learning 理論與算法研究，包括 low-shot learning、domain adaptation、self learning 等。獲得 AAAI 2021 Best Paper Award, 美國(guó) 2018 Rising Stars in EECS，及Adobe Collaboration Fund、Qualcomm Innovation Fellowship Finalist Award 等獎(jiǎng)勵(lì)。袁　航英國(guó)牛津大學(xué)計(jì)算機(jī)科學(xué)博士在讀、李嘉誠(chéng)獎(jiǎng)學(xué)金獲得者，主攻人工智能安全和深度學(xué)習(xí)在健康醫(yī)療中的運(yùn)用。曾在歐美各大高校和研究機(jī)構(gòu)研習(xí)，如帝國(guó)理工學(xué)院、馬克斯普朗克研究所、瑞士聯(lián)邦理工和卡內(nèi)基·梅隆大學(xué)。張鴻銘中國(guó)科學(xué)院自動(dòng)化研究所算法工程師。于 2018 年獲得北京大學(xué)碩士研究生學(xué)位。本科就讀于北京師范大學(xué)，獲理學(xué)學(xué)士學(xué)位。研究方向涉及統(tǒng)計(jì)機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和啟發(fā)式搜索。張敬卿英國(guó)帝國(guó)理工學(xué)院計(jì)算機(jī)系博士生，師從帝國(guó)理工學(xué)院數(shù)據(jù)科學(xué)院院長(zhǎng)郭毅可院士。主要研究方向?yàn)樯疃葘W(xué)習(xí)、機(jī)器學(xué)習(xí)、文本挖掘、數(shù)據(jù)挖掘及其應(yīng)用。曾獲得中國(guó)國(guó)家獎(jiǎng)學(xué)金。2016年于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系獲得學(xué)士學(xué)位，2017 年于帝國(guó)理工學(xué)院計(jì)算機(jī)系獲得一等研究性碩士學(xué)位。黃彥華就職于小紅書(shū)，負(fù)責(zé)大規(guī)模機(jī)器學(xué)習(xí)及強(qiáng)化學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用。2016 年在華東師范大學(xué)數(shù)學(xué)系獲得理學(xué)學(xué)士學(xué)位。曾貢獻(xiàn)過(guò)開(kāi)源項(xiàng)目 PyTorch、TensorFlow 和 Ray。余天洋啟元世界算法工程師，負(fù)責(zé)強(qiáng)化學(xué)習(xí)在博弈場(chǎng)景中的應(yīng)用。碩士畢業(yè)于南昌大學(xué)，是TensorLayer-RLzoo 開(kāi)源項(xiàng)目的貢獻(xiàn)者。張華清谷歌公司算法和機(jī)器學(xué)習(xí)工程師，側(cè)重于多智能體強(qiáng)化學(xué)習(xí)和多層次結(jié)構(gòu)博弈論方向研究，于華中科技大學(xué)獲得學(xué)士學(xué)位，后于 2017 年獲得休斯敦大學(xué)博士學(xué)位。黃銳桐 Borealis AI （加拿大皇家銀行研究院）團(tuán)隊(duì)主管。于 2017 年獲得阿爾伯塔大學(xué)統(tǒng)計(jì)機(jī)器學(xué)習(xí)博士學(xué)位。本科就讀于中國(guó)科學(xué)技術(shù)大學(xué)數(shù)學(xué)系，后于滑鐵盧大學(xué)獲得計(jì)算機(jī)碩士學(xué)位。研究方向主要涉及在線學(xué)習(xí)、優(yōu)化、對(duì)抗學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。廖培元目前本科就讀于卡內(nèi)基·梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院。研究方向主要涉及表示學(xué)習(xí)和多模態(tài)機(jī)器學(xué)習(xí)。曾貢獻(xiàn)過(guò)開(kāi)源項(xiàng)目 mmdetection 和 PyTorch Cluster，在 Kaggle 數(shù)據(jù)科學(xué)社區(qū)曾獲Competitions Grandmaster 稱(chēng)號(hào)，最高排名全球前 25 位。

你還可能感興趣

我要評(píng)論