袁卫/刘志波/郭念国
【内容提要】
统计学专业已经成为当今美国最热门的专业之一。美国统计学会的最新报告详细介绍了统计学和生物统计学专业的科研经费、学生就业及薪金水平等情况。美国国家卫生研究院于2001年和2003年先后两次召开专题会议,研讨生物统计学专业人才的培养、美国学界呼吁:加强下一代统计和生物统计专业人才的培养,特别要重视多重背景高层次统计学专业人才的培养。
【关 键 词】美国高等教育/统计学/生物统计学/人才培养
在21世纪,生物学中有关基因的研究,医学中有关基因与环境的病因研究,计算机网络在自然科学、经济、金融与市场中的应用,以及电子货币的普及等各种新事物的出现,都向统计学提出了许多新问题,将推动统计学的发展。美国的统计高等教育处于世界领先水平,本文将简要介绍美国统计高等教育的现状及其发展趋势,供中国统计教育工作者和相关人士参考。
一、美国统计高等教育的现状
(一)“统计学”成为当今美国毕业生的关键词
康奈尔大学的调查人员发现,利用统计技术迅速捕捉并引用媒体新发布的信息,这样就能获取广泛的关注度。在刚刚发布的一项调查研究中,康奈尔大学计算机科学家和社交网络研究员Jon Kleinberg和两位同事跟踪网络空间中信息流,搜寻“给猪涂口红”(2008年美国总统大选的时候,奥巴马的一句“你就算给猪涂上口红,它也还是只猪”曾经引起选民的广泛争议,同时,也让“给猪涂口红”这个出现于20世纪20年代的习惯用语重新回到人们的口中。一时间,“给猪涂口红”成了美国人民很爱用的一个短语,比喻想要把丑陋事物变美好而做的无用功。)这样的相关新闻主题,捕捉到了160万个新闻网站和博客。
IBM公司发现在数据搜索服务中有巨大的市场潜力,2009年4月他们创建了一个经营分析及优化服务小组,该小组将在研究实验室中吸纳超过200名数学家、统计学家和其他数据分析师——相对于IBM计划在整个公司中培养或新招超过4000分析师来说,200名这个数字并不够。
随着社会经济发展,数据量越来越庞大,新一代的统计学家利用强大的计算机和复杂的数学模型在海量数据中挖掘有用的信息和规律,使其广泛应用,如改进网络查询和网络广告,为癌症研究提供基因序列信息,为优化食品装运过程分析传感器和位置数据。
近年来数字数据量的飙升抬高了统计学家的声望,获得博士学位的统计专业毕业生在顶尖的公司工作,第一年起薪就能达到12.5万美元。如今,这些统计人才深受白宫的青睐。白宫预算与管理办公室主任Peter R. Orszag在2009年5月的一次讲话中表示:“稳健、真实的数据是制定长期经济需求及关键政策的首要步骤。”当天晚些时候,他在博客中坦言,关于统计数据重要性的言论是“发自内心的”。
2009年夏落下帷幕的Nettlix竞赛(DVD租赁公司Netflix在2006年宣布了一项竞赛,任何人只要发明了超过它目前使用的电影推荐算法Cinematch 10%的新算法,便能获得7位数的奖金),便是一场武装了现代统计的激烈竞争。
从其他方面也能看出人们对统计的兴趣日益浓厚。根据美国统计学会(ASA)的资料,2009年8月初在华盛顿举行的统计专业领域年度大会上出席人数达到6400人,超过了往年的5400人。无论男女老少,与会者们看上去很像来首都旅游观光的人群,但是,他们全神贯注的交流充满了随机、参数、回归和数据聚类等话题。
(二)美国的统计学及其相关专业
根据美国统计学会的资料[2],2006年美国共有211所学校提供与统计学相关的专业学位项目,共提供223个学士学位、333个硕士学位、240个博士学位项目。在211所提供统计学及其相关专业学位的学校中,专业及学位的配置情况如表1。
由表1可以看出:统计学是美国高等教育机构中最为普及的研究方向,顺次是生物统计学,其在研究生阶段的教育机构数远远高于本科阶段。
美国统计学会2009年4月做了一项2008-2009年度调查[3],向94个具有博士点的统计学或生物统计学院系进行了在线调查,共有41个回答了问题,其中统计学29个,生物统计学12个。统计学29个中全都提供硕士学位项目,只有22个提供学士学位项目;生物统计学12个中11个提供硕士学位项目,全都不提供学士学位项目。在21个提供统计学学士学位的院系中,大学本科统计专业学生及学士学位授予的情况如表2。
在提供硕士学位的院系中,硕士研究生及硕士学位授予的情况如表3(表中,括号外是来自29个统计学院系的数据,括号内是来自11个生物统计学院系的数据)。
硕士毕业生的就业情况如下页表4(表中,括号外是来自29个统计学院系的数据,括号内是来自11个生物统计学院系的数据)。
在提供博工学位的院系中,博士研究生及博士学位授予的情况如下页表5(表中,括号外是来自29个统计学院系的数据,括号内是来自12个生物统计学院系的数据)。
博士研究毕业生的就业情况如表6(括号外是来自统计学院系的数据,括号内是来自生物统计学院系的数据)。
224个博士研究毕业生中仅有1人失业,17人就业去向不详。
根据美国统计学会2008年4月所做2007-2008年度调查,统计学院系的外部资金来源情况如表7(第一行数据来自12个统计院系,且四舍五入至最接近的$25000,其他行数据来自13个统计院系)。
生物统计学院系的外部资金来源情况如表8(数据来自13个统计院系,第一行数据四舍五入至最接近的$25000)。
从表7~8可以看出,生物统计学的外部资金主要来源于美国国家卫生研究院(NIH),统计学的外部资金主要来源于美国国家卫生研究院之外的联邦政府机构,且美国国家科学基金会占主要部分。此外,生物统计学的外部资金约为统计学的2.5倍。
(三)美国统计学专业的就业情况
目前,统计学成为美国五大热门专业之一[4]。根据美国劳工统计局(BLS)和梅肯研究院的数据,Smart-Money杂志研究发现,富有成长性的5个研究领域——工程学、生命科学、统计学、环境科学、金融属于五大热门领域。梅肯研究院高级管理经济师Perry Wong说,统计专业的毕业生往往非常抢手,经常一毕业就被录用在有前途的职位上。
Google公司首席经济师Hal Varian说:“我坚持认为,在未来10年里,统计会是最具吸引力的职业。”Leeb资本管理公司驻纽约的首席投资官Stephen Leeb说:“无论是替代能源还是医疗保健,都需要统计分析来研究评估并做出抉择。”
统计学专业人员的工资水平也较高。根据美国劳工统计局的资料,美国统计学专业人员的工资情况如下几个表。
根据美国统计学会的资料,按职称和职称年限,把研究型大学统计学教师分为21组,助理教授组1~5、副教授组6~11和教授组12~21,每组的CPI工资按如下公式计算:
表7统计学的外部资金来源情况表(括号内数字为均值和中位数)
表8生物统计学的外部资金来源情况表(括号内数字为均值和中位数)
表9统计学专业人员工资总体情况表(2006年水平)
表10统计学专业人员最高就业率行业工资情况表(2006年水平)
表11统计学专业人员最高支付行业工资情况表(2006年水平)
在此列举几个组的工资情况如图1。
二、美国统计高等教育发展的趋势
(一)更加重视多重背景的高学位统计人才培养根据1990年至1994年间刊登在Amstat News(美国统计协会的官方时事通讯)上的招聘职位进行统计,大部分学术机构和政府部门职位都需要博士,企业也是如此,小部分职位需要硕士,更小部分职位需要学士。如今,各行业的公司都在寻找统计专家,包括制药公司、保险公司和华尔街的公司。制药公司特别喜欢生物统计专家,他们可以通过建模来检验药物。华尔街喜欢具有定量分析和大尺度建模技能的统计专家。
图12003-2007年CPI工资变化趋势图
网络巨大的数据量为科学研究与发现开辟了一片新天地。计算机和网络的普及为各个行业的数据挖掘开辟了新的领域——传感信号、监控录像、社交网络、公共信息等等。国际数据公司(IDC)公司的研究表明,今后数字数据量的增长还会加快,2012年将达到现在的5倍。然而数据仅仅是知识的原材料。麻省理工学院电子商务中心主任、经济学家Erik Brynjolfsson说:“我们正飞速迈入一切都将被监测和测算的时代,但最大的问题在于人们利用、分析和解释数据的能力。”专家表示,计算与数据分析技能远比学位重要。新一代数据分析领域的领军人物需要有经济学、计算机科学和数学等多重背景。
培养下一代生物统计学人员,不仅要有经典的统计理论与方法,包括临床试验和生存分析专题,而且也要有生物信息学、基础生物学以及沟通与领导能力。鉴于生物统计学和生物信息学在生物医学研究中的中心地位,领导能力比过去甚至重要得多。
(二)美国学界呼吁:培养下一代的生物统计学专业人员
生物统计学传统和新兴的方法应用领域包括临床试验、观察研究、成像学和基因组学。在医学与生物医学方面,生物统计学研究的50多年历史中,未来10年可能是最激动人心的。这将大大推动新基因识别的发展,这种新基因有助于疾病治疗、基因转移策略和基因治疗临床试验的发展以及新型预防治疗疾病制药的发展。然而,在遗传学、分子生物学和生物信息学方面训练有素的生物统计学专业人员的短缺,常常制约了学术界的新研究和新发现,也限制了生物技术制药公司的发展。
目前在美国,生物统计专业人员远远供不应求。生物统计在基因组分析、蛋白质组分析以及相关研究领域中起着关键作用,生物统计学博士、硕士毕业生相对不足,供不应求状况预计将继续扩大。此外,生物统计目前的培养项目吸引不了优秀本科生读研。当前美国大部分的高级生物统计学专业人员都是20世纪60年代后期和70年代早期培养的,而且在职业生涯早期,他们受到NIH的资助。未来10年,这批生物统计学者将陆续退休。NIH于2001年和2003年先后两次召开专题研讨会,讨论研究在美国需要培养更多生物统计专业人员来满足生物医学界日益增长的需要,并提出了培养下一代生物统计专业人员的建议[5]:
1.建立一套广泛的生物统计培养经费方案。个体机构提供的生物统计培养经费已经存在而且还将继续,但是培养项目的审查包括评估学生研究与赞助机构相关的程度和特定疾病专业毕业生的数量这两部分。当培养方案主要考虑生物统计学的培养质量以及毕业生在学术界、政府部门及工业界的专业成就时,需要一个新的培养经费方案。
2.拓宽新的或现有培养方案的范围。现在的生物统计学培养方案应当拓展到包括那些致力于生物信息学职业生涯的计算机科学、数学或统计学学生。生物信息学人员也像生物统计学人员一样严重短缺。计算生物学和神经科学等其它领域也在快速发展,也将需要多学科培养的人才。
3.提高产业界的参与。生物技术、制药和医疗器械产业已经成为生物统计学和生物信息学专业学生的主要雇主,然而他们对生物统计学培训的费用支持却远远低于NIH。除了为培训提供学费或助学金基金,产业基金可以用来资助暑期的实习。产业人员可以积极参与研讨会和讲习班。
4.改善生物统计学培养经费的对等审查制度。现在许多生物统计培养经费没有或者仅有一个生物统计学家的部门来评审。生物统计培养审查小组应当是同行,理想情况下,审查小组成员应当在学术部门有很强的科研能力和丰富的培养项目经验。
5.激发学生对生物统计学和生物信息学的兴趣。大部分数学与计算机科学大学生的培养项目都不重视统计学、生物统计学或生物信息学。应当支持大学生参加生物统计学和生物信息学方面的暑期实习。在暑期实习期间,大学生可以参加讲座和合作研究,这样可促使暑期实习生对生物统计学产生兴趣,申请到统计学或生物统计学研究院所读研。
6.发展支持非本地学生的新机制。现在申请读研的本土学生实际上并不能满足未来对生物统计学和生物信息学专业人员的短缺。大多数生物统计学或统计学培养项目,国外学生都占了很大比例,他们当中很多完成学位后仍留在美国。鉴于发展中国家严重不均衡的健康卫生问题以及发展定量分析技术的需要,对生物统计学培养,应当开发类似于福格蒂中心实施的HIV研究的培养经费方案。像补充ROI研究经费或项目拨款之类的创新型资助机制,能够提供更多急需的短期培养支持。
此外,还有生物统计培养项目的提议[5],该培养项目的主要内容简要概括如下:
1.生物统计学的基本理论和方法。传统的课程可能包括如数理统计(包含估计与推断理论)、概率论、线性模型(包含回归分析,方差分析和广义线性模型)、非参数方法和数据分析。如果时间允许,临床试验和流行病学等一些其他的培训是可取的。
2.生物学领域的专业知识。既然培养的目标是不仅把学生培养成出色的合作者,而且最终要成为独立的生物医学研究者,所以学生必须掌握生物学领域的专业基础知识。
3.合作者与研究者。无论课程学习还是动手实践,生物统计学专业人员都应当是研究团队中的一员,在研究项目的初期阶段都做出各自的贡献。但常常直到数据已经收集好以后生物统计学专业人员才加入,而且这时基本的设计缺陷已经致使数据没有可分析的意义。
4.沟通与领导技能。研究越来越是在一个由不同专长和背景个体构成的团队中进行了。下一代生物统计学专业人员,不仅要具有上面所述的技术专长和生物医学知识,而且还要具有与他们的研究同事有效交流统计和生物学概念的技能,这一点是至关重要的。从而,培养项目需要确保学生将获得必要的口头表达能力与书面写作能力。此外,还需要更好地培养自己在研究团队中的领导能力。
5.科研道德与信息隐私的培养。所有的NIH培养项目现在都要求培养学生的科研道德水平,比如,试验结果的精确汇报、负责任的作者以及前人研究成果的正确来源。最近,健康保险隐私与责任法(HIPAA)引进了在临床和基础研究中使用病人数据的隐私安全条款。由于生物统计学专业人员很可能从事这两个领域,他们必须对联邦和州的数据隐私安全法律非常熟悉。
【参考文献】
[1]Steve Lohr. For today's graduate, just one word: Statistics [EB/OL].[
[2]袁卫,关晓斌.国际统计高等教育概览[M].北京:中国统计出版社,2008:6-12.
[3]Keith Crank. ASA caucus of academic representatives report on the 2009 survey of departments of statistics and biostatisties[EB/OL]. 2009. http://www.amstat.org/outreach/pdfs/SurveyReport2009.pdf.
[4]AnnaMaria Andriotis. 5 college majors that can help you get a job [EB/OL]. [
[5]DeMets DL, Stormo G, Boehnke M, Louis T A, Taylor J, Dixon D. Training of the next generation of biostatisticians: a call to action in the U.S.[J]. Statistics in Medicine, 2006(25):3415-3429.
【原文出处】《统计与信息论坛》(西安)2010年1期第107~112页
【作者简介】袁卫,男,中国人民大学统
刘志波,男,中国人民大学统
郭念国,男,中国人民大学统