报告人:黄坚祐(香港理工大学)
报告时间:2026年3月14日(周六)11:00-12:00
报告地点:国交2号楼315会议室
报告摘要:两阶段抽样常被用于降低研究成本并提升估计效率。在许多两阶段研究中,第一阶段对大规模样本观测结果变量以及部分低成本协变量;第二阶段则从样本中选择一个子集,以获取高成本、更精准的协变量。因此,在分析结果变量与协变量间的关联时,会面临数据缺失问题。仅基于第二阶段样本的完整案例分析通常效率较低。本报告探讨一种两步估计法:首先利用完整数据获取初始估计量,随后通过建立结果变量与低成本协变量的工作模型,基于全数据构建渐近均值为零的估计量,用以对初始估计量进行校正。该两步估计量在渐近意义上至少与完整数据估计量同等高效,且对工作模型的误设具有稳健性。我们研究了该方法在高维回归与半参数生存模型中的应用,并提出了改进现有两步法效率的新方法。我们通过模拟研究展示了所提方法的优势,并在一项重大癌症基因组学研究中进行了实例应用。