2023年7月10日下午,G-Seminar计算机学科全球学术前沿系列讲座第七期暨计算机学院第27期“未来计算”学术前沿论坛在信息技术科研楼B413会议室隆重举行,学院邀请了新加坡南洋理工大学人工智能研究院联席院长、ACM杰出科学家安波教授作主题为“Distributed AI: Scalability, Efficiency, and Generalizability” 的学术报告。报告由计算机学院副院长向涛主持,计算机学院师生踊跃参加。
报告内容主要包括博弈论和多智能体博弈强化学习的前沿研究成果、应用实践以及未来可探索方向等。安波教授讲述,近些年来分布式人工智能受到越来越多的关注,相关的典型研究话题包括多智能体博弈、线上序列决策、分布式优化等,广泛应用于安全、游戏、金融、电商等领域。以复杂安全资源调配问题为典型,安教授介绍了社会安全领域普遍存在的挑战和基于博弈论算法的解决方案;在推荐系统领域,深度强化学习面临着奖励稀疏、探索昂贵等问题,安教授介绍了提升序列推荐中的用户长期留存的创新深度强化学习方法,这些方法切实提升了工业界的业务指标。此外,安教授介绍了其团队所研发的基于强化学习的开源量化交易平台: TradeMaster—交易大师,该平台涵盖四大金融市场,六大交易场景,15种强化学习算法以及一系列可视化评价工具,是一个统一的,端到端的,用户友好的量化交易平台。报告尾声时,安教授介绍了博弈论机器学习、博弈论表示学习、博弈论深度学习、分布式通用人工智能等可探索的研究方向。最后,安老师特别地针对在大模型时代所带来的机遇和挑战进行了分析,为学院师生的科研规划提出了宝贵的指导意见。
报告结束后,在座的师生积极提问,问题涵盖报告所述问题和技术的细节、学术界和工业界之间的差别与联系、学术方向选择和个人成长等主题,安教授耐心地向大家解答,给大家带来了新的思路和启发。最后,计算机学院副院长向涛与安教授针对科学研究、青年教师与学生的培养等方面进行了深入探讨和交流。通过此次学术报告,相关领域的教师和研究生更加深入了解了多智能体博弈强化学习的前沿技术研究及发展方向,拓展了学院师生在该领域的研究思路。
报告人简介:安波,新加坡南洋理工大学校长委员会讲席教授和南洋理工大学人工智能研究院联席院长,于2011年在美国麻省大学Amherst分校获计算机科学博士学位。主要研究领域包括人工智能、多智能体系统、算法博弈论、强化学习及优化。有100余篇论文发表在人工智能领域的国际顶级会议AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML、AISTATS。曾获2010 IFAAMAS杰出博士论文奖、2011年美国海岸警卫队的卓越运营奖、2012 AAMAS最佳应用论文奖、2016年IAAI创新应用论文奖,2020 DAI最佳论文奖,2012年美国运筹学和管理学研究协会(INFORMS) Daniel H. Wagner杰出运筹学应用奖,2018年南洋青年研究奖、以及2022年南洋研究奖等荣誉。受邀在2017年IJCAI上做Early Career Spotlight talk。他曾获得2017年微软合作Al挑战赛的冠军。并曾入选2018年度IEEE Intelligent Systems的Al’s 10 to Watch。他是AIJ、JAAMAS、IEEE Intelligent Systems、ACM TIST和ACM TAAS的副主编及JAIR编委会成员。他是AAMAS’20的程序委员会主席和AAMAS’23会议主席。当选为国际智能体及多智能体系统协会理事会成员、AAAI高级会员及ACM杰出科学家。