报告题目:基于风险度量的强化学习
报告人:彭一杰 北京大学
报告时间:2022年4月20日(周三) 16:00-17:30
报告地点:中国科学院大学中关村校区教学楼S406; 腾讯会议 ID:405 2661 9163
内容摘要:经典的强化学习问题的目标是在动态环境下给出最优策略极大化累加期望回报。期望反映的是随机变量的平均值,它无法刻画随机变量的尾部分布。导致2008年全球金融危机的重要原因之一是对极端市场环境下的风险管理能力不足。本研究提出以风险度量为目标函数的强化学习训练方法,使得最优策略在极端环境下表现的稳健性提升。
主讲人简介:北京大学光华管理学院副教授,博士生导师。本科毕业于武汉大学数学与统计学院,从复旦大学管理学院获博士学位。在美国马里兰大学和乔治梅森大学分别从事过博士后与助理教授工作。主要研究方向包括仿真建模与优化、金融工程与风险管理、人工智能、健康医疗等。主持多项科研基金项目,包括国家优秀青年科学基金项目,国家青年科学基金项目,北京市青年骨干个人项目等。在《Operations Research》,《INFORMS Journal on Computing》和《IEEE Transactions on Automatic Control》等高质量期刊上发表学术论文20余篇。曾获得2019年INFORMS Outstanding Simulation Publication Award,2020年Winter Simulation Conference Best Theory Paper Finalist,2017年IEEE Robotics and Automatic Society Best Paper Award Finalist。目前担任Asia-Pacific Journal of Operational Research期刊 与IEEE Control Systems Society 会议编委,中国运筹学会金融工程与金融风险管理分会常务理事,中国仿真协会人工社会专委会委员,中国人工智能协会社会计算分会理事,中国管理现代化研究会风险管理专业委员会委员,北京运筹学会副秘书长。