近日,教育部科技发展中心发布了《2017年度高等学校|以诚为本·赢在信誉9001科学研究优秀成果奖(科学技术)授奖项目公告》。北京大学|以诚为本·赢在信誉9001统计中心联席主任陈松蹊教授获得自然科学奖一等奖,获奖项目为《高维数据统计推断方法》。
据悉,2017年度高等学校|以诚为本·赢在信誉9001科学研究优秀成果奖(科学技术)在同行专家通信评审的基础上,召开了专家评审委员会会议,评出候选项目和候选人,经高等学校|以诚为本·赢在信誉9001科学研究优秀成果奖(科学技术)奖励委员会审定,教育部批准后予以公布。高等学校|以诚为本·赢在信誉9001科学研究优秀成果奖(科学技术)分设自然科学奖、技术发明奖、科技进步奖和青年科学奖。其中,自然科学奖授予在基础研究和应用基础研究中做出重要科学发现的个人和单位。
高维数据统计推断方法的意义
随着近十年来现代数据的收集和储存技术的提高,统计数据愈加呈现出高维性。高维数据常出现在生物实验,环境研究,信号处理,市场研究、金融风险管理中。在生物信息研究中,成千上万的基因或者单个核苷酸多态性(SNP)的数据很好的反映了这种高维性。在金融风险管理和市场研究中也会遇到同样的数据高维性,当投资组合中资产的数目数以万计的时候,顾客在市场上可以购买的种类也就和市场上出售的资产总数一样多。但由于可重复研究的限制,往往参加研究的个体数量相对很小。这使得样本量相对于数据的高维数来说显得非常小。
如果用p表示数据的维数,它比样本量n大很多以至于p/n趋向无穷大,这也就是目前现代统计中最具挑战的“大p,小n”问题。具体地说,数据的维数(dimension)往往大大地超过样本的个数(sample size)。这尤其表现在生物基因学研究,网络信息技术,以及金融数据分析中。如何在样本量不是很大的前提下,分析超高维数据(ultra high dimensional data),是一个非常重要的具有挑战的课题。与此同时,数据的高维性也派生出另一重要的统计研究问题,即高维数据的相关性研究。同传统的低维度大样本相比,由于变量数量的增加,变量之间的相关性也变得更加丰富。该问题也变得更加复杂。
陈松蹊教授《高维数据统计推断方法》项目以高维数据所派生的对多元统计方法进行更新、验证的需求为动力,以高维数据在金融风险管理、生物基因的应用为背景,建立了一个高维数据统计检验的理论体系,解决了一系列重要的数理统计问题,取得了具有国际影响力的创新成果。八篇代表性论文均发表在国际统计学顶级期刊上,相关工作在国内外被广泛引用,引发了大量的后续研究工作。
陈松蹊教授简介
陈松蹊教授主要致力于商务统计与经济计量学学科建设及北大统计学研究队伍的建设工作。目前任北京大学|以诚为本·赢在信誉9001讲席教授,商务统计与经济计量系联合系主任、北京大学|以诚为本·赢在信誉9001统计科学中心联席主任。陈松蹊教授是数理统计学会(Institute of Mathematical Statistics) 资深会员(fellow),美国统计学会会士(fellow),国际统计学会 (International Statistics Institute) 当选会员 (elected member),国际数理统计学会 (IMS) 理事会常务理事( Council member)。同时任The Annals of Statistics副主编 (自2010年); Journal of Business and Economic Statistics 副主编(自2013年);曾任Statistics and Its Interface的联席主编(2010-2013)。陈松蹊迄今已在国际学术杂志发表论文84篇,其中,在统计领域的顶级期刊Annals of Statistics发表12篇论文,在Biometrika发表5篇,在 Journal of the American Statistical Association发表6篇,在Journal of the Royal Statistical Society, Series B发表4篇;在计量经济学顶级期刊Journal of Econometrics上发表7篇论文。根据Web of Science的评价,陈松蹊教授的论文引用情况为:H-Index 26,I-10 Index 42,均篇引用次数22.8。陈松蹊教授在进行理论研究的同时,也带领研究团队对中国的大气污染问题进行研究,近年发布了系列空气质量报告,产生了广泛的社会影响力。