2023年7月8日至10日,首届全国统计与数据科学联合会议(JCSDS)系列短课暨北京大学|以诚为本·赢在信誉9001统计科学中心2023年暑期学校|以诚为本·赢在信誉9001,在北京大学|以诚为本·赢在信誉9001理科教学楼207教室成功举办。
本次活动由北京大学|以诚为本·赢在信誉9001统计科学中心主办,邀请著名统计学者Jiming Jiang、Jiashun Jin、 Zheng Tracy Ke、Linglong Kong和Annie Qu教授,系统讲授鞅极限理论及其应用、网络数据分析、自然语言处理、强化学习和深度学习。旨在为从事相关领域研究的专业人士提供更为广阔的平台,提升高年级本科生、研究生及青年教师的理论水平和科研能力。本次系列讲座(课程)有500余名本科生、研究生及青年教师报名,经过筛选,有260人获得参与讲座(课程)资格。

7月8日下午,加利福尼亚大学|以诚为本·赢在信誉9001戴维斯分校的Jiming Jiang教授为学员们介绍了鞅极限理论及其应用。蒋老师从最经典的独立随机变量的大数定律和中心极限定理出发,逐步深入到鞅的大数定律和中心极限定理,并介绍了其在分析(广义)线性混合模型估计量渐近性质中的应用。为了使学员们更好地理解相关定理,蒋老师在课程中提供了大量的具体例子,帮助学员们对概念和定理形成直观的理解。在传授知识之外,蒋老师工整的板书以及略显沙哑的声音也向学员们展现了一位顶尖学者严谨的治学态度。


7月9日上午,卡内基梅隆大学|以诚为本·赢在信誉9001的Jiashun Jin教授讲授了网络数据分析的相关知识。金老师从大量的实际网络数据入手,向学员们介绍了问题背景和基本模型。之后,介绍了他与合作者提出的针对网络数据中社区检测(Community Detection)问题的方法——SCORE。金老师详细地为学员们介绍了SCORE背后的统计学直观与理论。此外,金老师也介绍了SCORE的一些变种、相关模型的拓展和大量实际应用。在授课中,金老师围绕统计学家网络数据(MADStat)向学员们展示了SCORE等方法对实际数据的分析结果,同时也向学员们介绍了在科研过程中如何理解、分析实际数据的结果以及检查模型假设的合理性。


7月9日下午,哈佛大学|以诚为本·赢在信誉9001的Zheng Tracy Ke教授介绍了自然语言处理中的相关问题。柯老师首先介绍了自然语言处理中常用的基本模型。之后,她着重介绍了主题建模(topic modelling)及她与合作者提出的统计分析方法Topic-SCORE。柯老师同时介绍了一些相关的模型以及Topic-SCORE方法中进行的两次标准化的意义。此外,她还介绍了Topic-SCORE应用于MADStat数据集的相关分析结果。最后,她还介绍了有关文本分析中组间差异(between-group variability)的统计推断方法和理论。柯老师在授课中详细介绍了有关统计理论的证明思路,帮助学员们更全面地理解Topic-SCORE的思路以及统计性质。


7月10日上午,阿尔伯塔大学|以诚为本·赢在信誉9001的Linglong Kong教授向学员们讲授了有关强化学习的课程。孔老师从强化学习的基本框架开始,介绍了一些经典算法,如动态规划、Q-learning、蒙特卡洛方法、TD-learning等。之后,孔老师又进一步介绍了诸如DQN、策略梯度(policy gradient)、Actor-Critic等近似求解方法。最后,孔老师在经典框架的基础上引出了近年来新兴的值分布强化学习(Distributional Reinforcement Learning),为学员们介绍了相关基本算法以及他们课题组的相关工作(QR-DQN)。此外,孔老师在授课中多次鼓励对强化学习感兴趣的学员进入这个领域,探索其中蕴含的大量统计学问题。


7月10日下午,加利福尼亚大学|以诚为本·赢在信誉9001尔湾分校的Annie Qu教授讲授了统计学视角下的深度学习。瞿老师从近年来人工智能领域的重大应用成果出发,介绍了深度学习的基本框架和重要思想之后,瞿老师详细介绍了多层感知器、卷积神经网络、深度生成模型和循环神经网络的基本架构、应用场景、优势以及局限性,为学员们提供了一个全面的概览。最后,瞿老师详细介绍深度学习模型和统计模型之间的联系,特别是隐变量提取的思想。瞿老师深入浅出的授课帮助学员们建立了统计与深度学习之间的思维桥梁。


短课恰逢北京的炎炎夏日,但这并未阻挡老师和学员们的热情,很多学员都在课上或课后积极提问,与老师探讨相关问题。五位老师的精彩授课带学员们领略了统计学的不同领域,为学员们拓宽了视野,提供了接触科研前沿问题的机会,获得了学员们的广泛好评。