写在开头:大家在讨论后,认为可以向这篇文章学习的地方主要有两处:一是如何去论述自己的随机化是合理的,尤其是面对现实中复杂的有条件随机和不完全随机等状况;二是如何把不显著的结果自信的写出来。同时,几位老师认为,这篇论文披着种族平权的外套,隐藏了主要收益者是“少数族裔贵族”的真相,认为同样的数据和结果可以做一套关于“不平等”话题的叙事。但是出于政治正确等考量,美国同行可能不太敢这么写。最后,大家对这篇文章的最终去向拭目以待,是否最后只能发在JPubE上犹未可知,毕竟作者Sarah Cohodes是JPubE的co-editor嘛。
STEM暑期项目助力少数族裔学生的学业发展
——为“代表性不足青年“开设的STEM暑期项目增加了STEM领域学位的获得率
Sarah R. Cohodes , Helen Ho , Silvia C. Robles
NBER: 30227
DOI: 10.3386/w30227
引入: 联邦政府投资支持了面向高中生的STEM暑期强化项目,但少有严谨的证据证明它们的有效性。作者进行了一项随机对照试验,研究“代表性不足群体”的高中生在一所名牌大学里参与此类项目的情况。STEM暑期课程在时长(一周、六周或半年)和模式(线上或线上)上有所不同。研究表明,参加STEM暑期项目的学生更有可能进入大学、坚持读完全程并从大学毕业。暑期项目使得参与者有更多机会进入更优质的大学就读,这一转变可以解释毕业率的增长。暑期项目还提高了学生在STEM领域获得学位的可能性,获取STEM学位将使得学生未来的潜在收入增长。
一 社会现状
黑人和西班牙裔劳工在 STEM 领域中代表性明显不足,在工资、学位的比较中显著落后于其他族裔。大约 9% 的 STEM 学士学位授予了黑人学生,16% 的 STEM 学士学位授予了西班牙裔学生,但这些群体分别占美国大学人口的 14% 和 21% 。STEM学位的差异不是由于兴趣的差异,进入大学后计划主修STEM专业的“代表性不足群体”(URM)学生与同龄的白人学生比例相当,但 URM 学生更有可能转专业或辍学/休学。
二 项目简介
这篇文章基于一项多期暑期项目随机试验,从申请课程到大学毕业对学生进行全流程追踪。
该项目由东北部的一所名牌大学 HI 主办。HI设有“外联办公室”专门负责STEM强化课程项目,目的在于增加URM学生在STEM领域的代表性。针对高中生的暑期项目是本研究的重点,试图通过让URM学生接触成绩优异的同学、经验丰富的导师;参与更多STEM课程;体验大学生活;获取更详细的大学招生信息等等,来增加URM学生未来进入STEM行业的机会。HI提供的三类子项目分别是:6周全日制线下课程 / 1周全日制线下课程 / 6个月定期线上课程。该项目面向全美进行招生,除往返HI的交通费外的其余所有费用均可获得资助。
随机控制实验持续了三期(即对该暑期课程持续研究了三年):2014 年、2015 年和 2016 年。每批学生进入该项目时的均处于 Grade 11 衔接Grade 12 的暑假,这段时期恰好是申请大学的准备期。可以类比为高二升高三的那个暑假。每一年的暑假,当年度的STEM暑期项目参与者都被随机分配到四组:三组不同形式的 STEM 暑期项目组以及一个对照控制组。
三组不同形式的 STEM 暑期项目组在模式和内容上有所不同:
- 6周课程在校园内举行,提供了HI大学浓缩版大一课程以及其他咨询、考察活动,让学生亲身体验大学生活。
- 1周课程提供短期强化课程以及6周课程中其他活动的简化版本。
- 6个月定期在线课程提供为期半年的丰富活动,包括在线演说和远程学术互动,并可在夏季实地访问校园。
- 对照组:被随机分配到对照组的学生也申请了HI的暑期项目,但没有被分配上述三组。 然而,这些申请者通常也是优等学生,他们中的大多数人参加了其他的暑期项目,例如由其他大学或社会团体举办的项目,少部分人参加工作或者独立学习。
三 研究方案
3.1 数据来源与描述性统计
3.1.1 数据来源
数据主要来自两个方面:HI的项目申请和录取信息,以及国家学生信息交流中心(NSC)的大学入学和注册信息。
-
申请人都是通过有条件的随机分配被录取的,随机分配所依据的背景信息来自于申请人,其中包括个人信息、学术资格等诸多方面。HI外联办公室提供了数据和录取细节。
-
大学入学、注册数据来自HI研究办公室和NSC。数据截止到2021年春季,几乎所有申请者都出现在HI或NSC的大学数据中。HI研究办公室额外提供了申请就读HI的申请人以及其就读专业的信息,NSC数据额外包括了学生的专业信息。
该研究还收集了来自研究样本的定期调查数据。
-
更周详的长调查追踪三个时间点:当年秋季;参与人高三的五月以及参与人大二的春季。当年秋季的调查包括关于大学的计划、申请相关知识、预期的专业、学习和生活技能等问题;高三五月的调查收集了关于大学申请和录取的信息以及后续的计划;大二春季进行的调查询问了关于大学经历、专业和职业意向的问题。
-
更短、更频繁的调查则是跟踪大学入学率和学生最终或预期的大学专业。
-
受访者若参与调查可得到亚马逊礼品卡,参与长调查可获得价值25美元的奖励,参与短调查则可获得价值5美元的奖励。
3.1.2 描述性统计
表 1 报告了样本的人口统计学信息和学术背景等信息。由于随机化设计包括分层,所以我们并不需要期望处理组和对照组在所有特征上都完全相似。第 6 - 8 列表明,经过随机化分层调整后,处理组和对照组间的差异确实更小。注:本文所有表格中均有: + p<0.10 ; * p<0.05; ** p<0.01; *** p<0.001。
3.2 随机化过程
3.2.1 初筛进入随机化池
每年,在最基本的筛选后,外联办公室将大约 600 - 750 名合格的申请人送到甄选委员会,遴选委员会根据申请人的成绩、考试成绩、推荐信,对学术准备和个人情况进行详细评分和排名。此外,由于该项目的初衷是助力URM学生进入STEM领域,遴选委员会将从整体上考虑以下因素。
1. 申请人是家庭中第一个上大学的人;
2. 申请人的家庭成员没有科学和工程背景;
3. 申请人的高中在过去向大学输送的高中毕业生不到50%;
4. 申请人就读的高中的毕业生很难进入名牌大学(如农村地区的高中或以非裔美国人为主的高中);
5. 申请人属于在科学、工程研究领域中代表性不足的群体(非裔美国人、西班牙裔或拉美裔等)。
此外,外联办公室要求部分区域优先录取,以增加全国各地的代表性,这项要求对2015年和2016年的申请人排名产生了影响。以及由于各种原因被豁免随机化的学生被称为“确定样本”,被排除在本文的分析之外。在对所有学生进行排名后,HI研究办公室创建了一个排名变量,该变量是申请人评级和区域优先级的加权平均值,该变量被用来将学生分配到特定区块。
3.2.2 划分区块与随机分配
由于HI办公室希望确保排名靠前的学生有机会参加暑期项目,研究采用了区块随机化设计,使用排名变量将学生放入随机化区块。
一般来说,排名变量最高的学生被安排在区块1,并在三个暑期项目之间随机分配。为了保持项目中的性别平衡,对男女学生有不同的排名截止点。其余的学生被安排在区块2,并被随机分配到在线课程和对照组中。这种随机化方案构成了实验的第2批(2015年)和第3批(2016年)的研究设计。在2014年参加项目的第一批学生经历了略微不同的设计,学生在三个区块内随机分配。后续实证中包括第一批学生和不包括第一批学生的结果非常相似。
随机化设计的关键部分是在线项目在各区块之间都存在,我们用它来进行区块1中三类子项目的样本和区块2中控制组样本之间的比较。这种推断背后的关键假设是,如果我们控制随机化分层(基于申请年份、性别、区块等),我们就能将区块1中属于某子项目组的申请人与区块2中属于某组的申请人进行比较。
四 实证策略
其中,方程左边是申请人i的结果变量,前三个是课程哑变量。申请人层面的控制变量 X 包括GPA、标准化数学分数、种族/民族、是否享受免费和减价午餐等等。在后述的随机化分层中还考虑了性别因素。实证采用异方差稳健标准误。估计策略的关键是包括随机化分层变量 Rij。该变量包含申请人在所申请年度内形成的一些分层指标:性别、地区偏好和随机区块。在分层内,录取到哪个子项目是随机的。
作者的估计方法是比较同一批次、同样性别、同属某一区域和同一随机化区块内的学生。表1第 6 至 8 栏中显示:一旦控制随机化分层,申请人特征就没有什么差别。控制随机化区块后,就等同于控制了所有区块之间的差异,继而就可以将随机分配到处理组的学生与对照组的学生进行比较。两个区块中都包括在线课程,这为作者估计这种比较提供了联系。
即便说的天花乱坠,可毕竟不同于完全随机分配,因此作者在后续展示了替代性的估计策略并做了一些稳健性检验。基于这些证据,作者认为控制随机化分层情景的回归估计值将接近于完全随机分配情景下的估计值。
五 回归结果
5.1 入学与坚持学业
-
三个项目都增加了申请HI大学、接受 Offer 和注册入学的可能性,其中影响最大是6周课程。STEM 暑期课程也增加了《巴伦周刊最具竞争力院校榜单》上其他大学的入学人数,具体来说,6周课程只影响 HI 大学的入学率;而1周课程和在线课程则分别影响了HI 大学和榜单大学的入学率,尽管有些影响在统计上并不显著。
-
同时,作者认为结果反映了申请人向名牌大学的转移的现象。见第4 - 5列,6周课程使得包括HI在内的榜单大学的入学人数显著增长17.2%,1周课程使其增长13.6%,在线课程使其增长10%。对于6周课程来说,向名牌大学的转移效应主要还是基于HI,因为除了HI之外的其他榜单大学的入学率没有区别(第5列)。对于1周课程和在线课程来说,作者认为它们对HI和其他榜单大学都有作用,即便是不显著。
-
处理组的学生保持了相似的入学率,而对照组的学生则逐年下降。在第一年,86.7%的对照组学生入学;到了第四年,对照组的入学率下降到75%(意味着不明原因的辍学或休学)。对照组学生入学人数的下降主要来自非HI大学:在第三年,73.7%的对照组学生在非HI大学就读,但到第四年则下降到68.4%。
-
反观处理组,那些被STEM (任一)子项目录取的学生仍完成注册入学的可能性要高出 3% - 12%,这里的效应主要来自榜单大学而不是 HI 大学。
5.2 毕业率
- STEM暑期项目也提高了大学的准时毕业率。在对照组中,只有53.2%的学生准时从四年制大学毕业,STEM 暑期项目的对应值增加了 8%(6周课程和1周课程)和 1.6%(在线课程),虽然差异在统计上不显著。观察表中六年内的毕业结果,可以发现6周课程的准时毕业效应仍然大部分是通过 HI 大学来实现的;而在1周课程和在线课程中,HI 和其他榜单大学均有毕业人数增加的显著效应。
- 作者在附录表 B.5 中进一步探讨了毕业增长的来源,表明了大多数的毕业增长来自于那些本来不能按时从四年制大学毕业的学生,另一部在增长则来自于就读机构等级的提升。作者认为,大学毕业率的提高既来自于更多的按时毕业人数,也来自于就读机构等级的提升,即该暑期项目助力申请人从排名较低的大学转移到HI或其他高排名大学就读,不过好像不显著。
5.3 STEM学位获取和潜在收入
-
学位获取的增长完全集中在 STEM 领域,这反映出学位按时获取数的增加以及毕业生向 STEM 领域的转移。在对照组中,四年内获得学位毕业的学生占53.2%,其中获取STEM 学位的有 36.8% ;在处理组中,6周课程将四年内STEM 获学位毕业率提高到 49.5%,1周课程提高到 46%,在线课程提高到 40.2%,统计上均不显著。
- 作者使用Sloane等(2021)提出的“潜在收入”概念,将潜在收入定义为按专业划分的“美国出生的白人中年男性 ”的年对数收入,由2014 - 2017年的美国社区调查计算得出。作者为样本中的每个申请人分配其专业的潜在收入,并按收入绘制专业的分布。学位分布的变化将反映出由专业构成而引起的潜在收入变化。对潜在收入的保守估计表明:申请人将修读专业向 STEM 专业转移将导致 2% - 6% 的潜在收入增长。
5.4 异质性分析
在附录中作者按性别、是否属于URM群体、免费或减价午餐领取情况(表征家庭收入)和是否是第一代大学生等进行异质性分析:
-
男生和女生都从6周课程中受益,但女生在1周课程和在线课程中获益更大。作者认为这并不奇怪,因为女性选择STEM专业的可能性较小,所以有更大的提升空间。
-
作者将黑人、西班牙裔和美国原住民与非URM群体(白人、亚裔、多民族和“其他种族”)作了区分,由于仅不到18%的样本属非URM,估计无疑会有偏误,但有限证据表明暑期项目对这两类群体都有很大好处。
-
最明显的差异来自于是否在高中接受午餐补贴。没有接受午餐补贴的学生获益更大,特别其中毕业于名牌大学和获得STEM学位的学生。拥有更多资源的学生可能为转向更好的大学就读做了更多的准备。这也从侧面反映出,增加STEM领域的多元民族/种族代表性,未必会增加不同收入群体的代表性。
-
无论是否是第一代大学生,参与人都从参加STEM暑期项目中受益,但6周课程使得第一代大学生获益更多,这可能是由于他们中的更多人的转移到了HI就读。而该暑期项目中的转向非HI名牌大学就读的好处,可能对已经拥有社会资本的群体更有利。
5.5 各种检验
1. 控制区块 回归 vs. 不控制区块 回归
控制区块 + 控制排名变量 回归 vs. 基准回归
不控制区块 + 控制排名变量 回归 vs. 基准回归
2. 不含协变量 + 逐列剔除cohort 回归
3. 安慰剂检验
六 机制分析
在分析中作者使用了学生调查的数据。由于作者认为各种加权方案的影响不一致,故使用了未加权的调查数据,并认为基于此的实证结果仅具有提示意义,而不具备结论性质。
作者聚焦分析三个与人力资本相关的解释,试图揭露暑期项目提高大学毕业率和STEM学位的获得率的机制。
-
首先,这些项目可以通过增加参与者在大学申请过程中的人力资本来助力学生转向更高质量的大学就读,作者同时研究了STEM暑期项目是否会具有信号效应。
-
其次,该项目可能会提高参与者在学科知识方面的人力资本,使得他们更容易毕业。
-
最后,考虑参与人的人力资本是否在软技能方面有所提高,使他们在大学里更容易取得成功。
6.1 申请大学的过程
作者表明,参与者的申请和录取情况发生了变化,可以观察到申请HI和其他名牌大学的人数均有增加。约31%的对照组学生申请到HI,其中近11%的成员被HI录取,这意味录取率约为34%。被分配到6周课程的学生中约有31%被HI录取,隐含录取率为40%;1周课程中约21%的学生被录取,录取率约为30%;在线课程中约19%的学生被录取,录取率约为29%。
-
在HI之外,入学和毕业也发生了变化,一些子项目将学生转移到HI以外的名牌大学(特别是1周课程和在线课程)。调查对象在高三五月进行的长调查中报告了他们的大学申请和录取情况。如上表第5列中显示:STEM暑期项目参与者更有可能申请除HI外的巴伦榜单最具竞争力大学并获得录取。
-
6周课程可以显著降低学生只申请一所学校的可能性,虽然数值很小。而1周课程和在线课程的可能性更是6周课程的一半,且不太显著。作者认为申请行为的变化诱发了更多进入更高质量大学就读的机会。
作者试图研究入学更高质量的大学是否会导致毕业率的提升和学位获取的增加。这需要比较“学生进入大学的第一年度的学校层级毕业结果”和个人真实情况的毕业结果,作者给那些在大学第一年就读的学生分配了该大学特定的毕业率。然后假设他们按照所就读的大学毕业率毕业,那么这个结果就衡量了每个处理组的 “预测”毕业率。同时为 STEM 学位获取构建了一个类似的模型。结果见表5。
-
A组比较了 “实际毕业率”和 “预测毕业率”的差异。对于6周课程和1周课程,实际四年毕业率的变化几乎与预测毕业率的差异完全一致,说明就读大学质量的提升确实带来毕业率的提升。
-
B组显示,6周/在线课程增加了STEM学位预测获取率,但实际获取的增加甚至比预测值更大。
6.2 信号效应
-
跟据附录表B.14中面板A的有条件录取结果(第3列)显示,参与STEM暑期项目使得参与人被某所大学录取的可能性增加了,这可能是由于学生申请材料或人力资本方面的信号的诱导。
-
在HI,入学人数的增长部分是由于申请率的增加,部分增长来自STEM暑期课程的增长效应(6周课程使其增加了14.2%,1周课程和在线课程分别使其增加了4.9%和5.5%,尽管在统计上并不显著)。在非HI的名牌大学,1周课程和在线课程分别将有条件录取的可能性提高到6.2%和5.4%,但只有后者显著。
-
面板B将STEM暑期课程参与者与有过其他STEM经历的对照组成员进行了比较。作者假设不同的STEM暑期项目经验可以带来相同的人力资本收益,那么让参与HI大学举办的STEM暑期项目的人与参与其他STEM暑期项目的对照组成员进行比较,可以验证HI的项目是否具有高于其他STEM暑期项目的信号价值。
-
结果表明,即使是这个对照组,6周课程的有条件录取仍有10.7%的提高(但不显著),但1周课程和在线课程没有区别。作者对不同项目中人力资本收益相同的假设也可能是错误的,但这些发现为信号机制的探索提供了一些启示。
6.3 学科知识、技能与信心
STEM暑期项目提升毕业率和STEM学位获取的另一个原因可能是通过增加学生的STEM学科知识来帮助他们取得先发优势。这可能有两种渠道:这些项目通过在大学入学前提供STEM课程直接增加相关知识;或是在此过程中提高学习能力等一般性技能,以及自信、自尊等软实力。
-
大多数学生计划在高三至少参加一门高级预科(AP)或国际文凭(IB)课程。如面板A所示,暑期项目增加了计算机类课程的参与率,但对科学类课程和数学类课程几乎没有影响。高三五月的长调查中,暑期项目参与者能更好地回答微积分问题,尽管差异在统计上并不显著。
-
面板B显示了学生对生活技能、学习技能、信心、学习兴趣等问题的调查回答。生活技能包括按时设置闹钟和洗衣服等任务。与在线课程相比,实地项目(6周课程和1周课程)在生活技能的提升方面效应更大。对于信心的效应是积极的,虽然没有统计学上的显著变化。生活技能、学习技能有正向而显著的提高。
七 结论与贡献
7.1 结论
- 作者重申了实证的结果。
- 作者涉及了成本效益分析的话题,认为何种课程最具成本效益的评判将因目标院校不同而异。
- 作者认为这项有针对性的暑期项目将有广泛的好处。随着最高法院持续削弱大学直接招生中的平权措施,更多大学可能会转向暑期项目,并通过间接途径为种族多样性助力。
- 作者认为,仅关注学生申请大学后的经历并不足够,在申请大学之前的时期对学生进行辅助干预也很重要。
7.2 贡献
- 已有研究对学生进入大学前的准备经历的影响关注不多,且较少考虑社会背景的差异,这篇文章增补了关于STEM学位获取的研究,提供了支持STEM学位获得者背景多元性的证据。
- 这篇文章有助于深入了解大学入学率的相关情况,理解学生的学业准备和大学档次之间的可能存在“适应与匹配”(好的选择能带来好的结果),可以更好挖掘大学教育在减少种族不平等方面的潜力。
- 这篇文章与关于大学招生中平权行动的影响的大量文献相呼应,为利好URM学生的政策提供了证据。前人的研究指出,“利好政策和学生择校间往往产生不匹配”,本文正好为相反的观点提供了反证。
分享者: BRYCE YU