伟德官网 - 伟德全称

科學研究

美國伊利諾伊大學芝加哥分校劉德榮教授訪問我校并做學術報告

作者：冒澤慧審核人：訪問量：1598發布時間：2019-12-24

2019年12月23日下午美國伊利諾伊大學芝加哥分校劉德榮教授，應南航國際交流合作處和伟德官网邀請進行了訪問，在伟德官网1号樓403會議室并作了題為“Reinforcement Learning for Optimal Control”精彩的學術報告。學術報告由姜斌副校長主持，陳謀副院長、吳慶憲教授、劉春生教授、陸甯雲教授等師生們參會，參會師生對劉德榮教授來訪交流表示熱烈歡迎。

報告開始劉教授提及，RL和ADP都起源于動态規劃，在許多方面它們是等價的。自2006年引入疊代ADP方法以來，ADPRL在最優控制方面取得了重大突破。然而非線性系統的最優控制要求解非線性Bellman方程，而不是線性情況下的Riccati方程。離散時間Bellman方程比Riccati方程更難處理，因為它涉及到求解非線性偏差分方程。雖然動态規劃是求解最優控制問題的一種有用的計算技術，但由于求解過程需要逆向的數值過程，即衆所周知的“維數詛咒”。基于ADPRL的自學習最優控制為解決以下兩個問題提供了有效的工具。(1)采用疊代ADP方法求解非線性Bellman方程，該方法具有收斂性。(2)利用神經網絡進行函數逼近，得到正演數值過程。報告最後劉教授介紹了ADPRL最優控制的一些新進展。

學術報告後，參會的碩博士對于劉教授報告的内容進行提問，得到劉教授詳細的解答，并與參會老師合影留念。

随後，劉德榮教授在南航伟德官网1号樓303報告廳舉行“2020美國伊利諾伊大學芝加哥分校（UIC）本科交流及碩士學位（工程類專業）項目”宣講會。

報告人簡介：劉德榮教授是美國伊利諾伊大學芝加哥，電子與計算機工程和計算機科學的全職教授，入選中國科學院“百人計劃”，2010年至2015年任自動化研究所複雜系統管控國家重點實驗室副主任，《人工智能評論》(施普林格)的主編，2010年到2015年的IEEE神經網絡和學習系統會刊的主編，IEEE會員，國際神經網絡協會會員，國際模式識别協會會員。他在神經網絡、最優控制、強化學習領域有着重要和持續的影響力。

科學研究

通知公告

科研動态

科研成果

科研基地

安全管理

大型儀器設備

保密管理

資産設備

制度規範流程

科學研究

美國伊利諾伊大學芝加哥分校劉德榮教授 訪問我校并做學術報告

美國伊利諾伊大學芝加哥分校劉德榮教授訪問我校并做學術報告