當前位置:首頁  科學研究  科研動态

美國伊利諾伊大學芝加哥分校劉德榮教授 訪問我校并做學術報告

作者:冒澤慧 審核人: 訪問量:1598發布時間:2019-12-24

20191223日下午美國伊利諾伊大學芝加哥分校劉德榮教授,應南航國際交流合作處和伟德 官网邀請進行了訪問,在伟德 官网1号樓403會議室并作了題為“Reinforcement Learning for Optimal Control”精彩的學術報告。學術報告由姜斌副校長主持,陳謀副院長、吳慶憲教授、劉春生教授、陸甯雲教授等師生們參會,參會師生對劉德榮教授來訪交流表示熱烈歡迎。


報告開始劉教授提及,RLADP都起源于動态規劃,在許多方面它們是等價的。自2006年引入疊代ADP方法以來,ADPRL在最優控制方面取得了重大突破。然而非線性系統的最優控制要求解非線性Bellman方程,而不是線性情況下的Riccati方程。離散時間Bellman方程比Riccati方程更難處理,因為它涉及到求解非線性偏差分方程。雖然動态規劃是求解最優控制問題的一種有用的計算技術,但由于求解過程需要逆向的數值過程,即衆所周知的“維數詛咒”。基于ADPRL的自學習最優控制為解決以下兩個問題提供了有效的工具。(1)采用疊代ADP方法求解非線性Bellman方程,該方法具有收斂性。(2)利用神經網絡進行函數逼近,得到正演數值過程。報告最後劉教授介紹了ADPRL最優控制的一些新進展。

學術報告後,參會的碩博士對于劉教授報告的内容進行提問,得到劉教授詳細的解答,并與參會老師合影留念。

随後,劉德榮教授在南航伟德 官网1号樓303報告廳舉行“2020美國伊利諾伊大學芝加哥分校(UIC)本科交流及碩士學位(工程類專業)項目”宣講會。

 

報告人簡介:劉德榮教授是美國伊利諾伊大學芝加哥,電子與計算機工程和計算機科學的全職教授,入選中國科學院“百人計劃”,2010年至2015年任自動化研究所複雜系統管控國家重點實驗室副主任,《人工智能評論》(施普林格)的主編,2010年到2015年的IEEE神經網絡和學習系統會刊的主編,IEEE會員,國際神經網絡協會會員,國際模式識别協會會員。他在神經網絡、最優控制、強化學習領域有着重要和持續的影響力。


電話:+86-25-84892368 傳真:+86-25-84892368
地址:中國江蘇省南京市江甯區将軍大道29 号 1003分箱 版權所有:伟德 官网 - 伟德全称
書記信箱 院長信箱 紀檢委員信箱

Baidu
sogou