nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo searchdiv qikanlogo popupnotification paper paperNew
2025, 07, v.40 3-16
规模以下工业调查的分层二重抽样方法研究
基金项目(Foundation): 国家社会科学基金重大项目“新时代共同富裕实现程度的统计测度及实现路径研究”(22&ZD155)
邮箱(Email):
DOI: 10.20207/j.cnki.1007-3116.2025.0029
摘要:

规模以下工业调查所提供的经营活动指标对于工业统计至关重要。国家现行方案依据最新经济普查数据构建双重抽样框,从中抽取固定样本连续调查多年,以构造非经济普查年规模以下工业经营活动指标的HT估计量。目前,规模以下工业单位流动性高且变动频繁,将直接影响固定样本对非经济普查年目标总体的代表性。因此,提出在非经济普查年,采用基于双重抽样框的分层二重抽样方法。每年度先抽取一个大样本用于估计规模以下工业总体的新增率、消亡率以及规模大小。再利用一个较小的第二重样本进行实际调查,并结合由第一重样本所得数据优化的抽样权数,最终给出规模以下工业总体总量估计。推导其抽样偏差和方差,构造基于刀切法的方差估计量。针对非经济普查年规模以下工业营业收入总额的估计,验证了新方法相较于现行固定样本HT估计量的精度更高。该研究有助于提高非经济普查年规模以下工业调查经营活动指标估计的可靠性,并为相关调查方案设计提供理论依据。

Abstract:

The business activity indicators provided by industrial surveys under a designated size are of crucial for industrial statistics.The current national scheme adopts a dual sampling frame based on the latest economic census data to select a fixed sample for continuous survey multiple years, in order to construct a HT estimator for indicators of industrial activities under a designated size in non-census years.At present, the high liquidity and frequent fluctuations of industrial units under a designated size will directly affect the representativeness of the fixed sample to the non-census years target population.This article proposes a stratified double sampling method based on double sampling frame in non-census years.This method requires that the sample be taken again every year.The overall approach begins by drawing a large sample to estimate the growth rate, extinction rate, and size of the industrial units below a designated size.Subsequently, using the actual survey data from a smaller second-phase sample, combined with sampling weights optimized based on information obtained from the first-phase sample, estimates for the population of the industrial units below the designated size are provided.Derive its sampling bias and variance, and construct a variance estimator based on the knife cut method.The new method has been validated to have higher accuracy compared to the current fixed sample HT estimation for estimating the total industrial operating income under a designated size of non-census years.This research contributes to improve the reliability of economic index estimation and provides theoretical basis for related survey scheme design.

参考文献

[1] 雷平静.《工业统计定期抽样调查试点方案》的设计[J].统计研究,1997,14(5):69-74.

[2] 王莹,万舒晨.大数据时代抽样调查面临的挑战与机遇[J].统计与信息论坛,2016,31(6):33-36.

[3] 马金萍,刘小铃,温欢乐.双重抽样框下项目无回答插补估计方法研究[J].统计与信息论坛,2024,39(5):3-15.

[4] 金勇进,姜天英.规模以下工业调查的若干问题研究[J].统计研究,2019,36(3):42-50.

[5] HARTLEY H O.Multiple frame surveys[R].Proceedings of the social statistics section,American Statistical Association,1962:203-206.

[6] FULLER W A,BURMEISTER L F.Estimators for samples selected from two overlapping frames[R].Proceedings of the social statistics section,American Statistical Association,1972:245-249.

[7] LOHR S,RAO J N K.Estimators in multiple frame surveys[J].Journal of the American Statistical Association,2006,101(475):1019-1030.

[8] BANKIER M D.Estimators based on several stratified samples with applications to multiple frame surveys[J].Journal of the American Statistical Association,1986,81(396):1074-1079.

[9] SKINNER C J,RAO J N K.Estimation in dual frame surveys with complex designs[J].Journal of the American Statistical Association,1996,91(433):349-356.

[10] 陈光慧,刘建平.我国基本单位多水平连续性抽样调查体系改革研究——以规模以下工业调查为例[J].统计研究,2014,31(7):50-57.

[11] 巩红禹.规模以下工业抽样调查中代表性样本的一种探索设计:平衡抽样设计[J].统计与信息论坛,2017,32(4):8-15.

[12] 张维群,成鹏东,杨静宜.基于“三新”经济动态总体的事后分层抽样方法[J].数理统计与管理,2024,43(6):951-961.

[13] 贺建风.基于多重抽样框的校准估计方法研究[J].统计研究,2018,35(4):104-116.

[14] 姜天英,金勇进.规模以下工业企业抽样调查的权数调整研究[J].工程数学学报,2024,41(2):199-216.

[15] 张维群,段格格.基于“三新企业”抽样调查的事后分层复合抽样设计[J].统计与信息论坛,2021,36(7):3-9.

[16] 吕萍.重权数在复杂调查的方差估计中的应用[J].统计研究,2011,28(2):93-99.

[17] 孟杰,沈文静,杨贵军,等.复杂抽样的Bootstrap方差估计方法及应用[J].数理统计与管理,2021,40(2):266-278.

[18] 马志华,陈光慧.校准估计理论及其应用研究综述[J].数理统计与管理,2015,34(6):1029-1039.

[19] 万舒晨.规模以下工业抽样设计研究[J].统计研究,2021,38(6):116-127.

[20] 孟杰,沈文静.人口名录库及其在人口普查中的应用[J].统计与信息论坛,2018,33(10):90-97.

[21] 金勇进,刘晓宇.权数对基于模型推断的影响分析[J].统计与信息论坛,2022,37(3):3-13.

[22] 王小宁.权数在人口抽样调查估计中的应用研究[J].统计与信息论坛,2019,34(12):9-15.

[23] 张维群,成鹏东.基于“三新”企业分层抽样单元权重动态调整的估计方法[J].统计与信息论坛,2024,39(3):3-13.

[24] 胡桂华,LóPEZ-CARR D,黄艳华,等.人口普查遗漏的组合式估计方法[J].统计与信息论坛,2024,39(2):3-14.

[25] 胡桂华,文婷,刘誉环.基于组合式三系统估计量的人口普查净误差估计[J].统计与信息论坛,2022,37(8):15-27.

[26] 罗薇,贺建风,谢贤芬.基于测量误差的Fay-Herriot模型在小域估计中的应用研究[J].统计与信息论坛,2023,38(12):3-13.

[27] 杨贵军,沈文静.广义回归估计量在中国农业抽样调查中的应用研究[J].统计与信息论坛,2020,35(6):10-16.

[28] SHAO J,TU D.The jackknife and bootstrap[M].New York:Springer-Verlag,Inc,1995:23-70.

[29] WOLTER K.Introduction to variance estimation[M].New York:Springer Science Business Media,LLC,2007:1-10.

[30] 孟杰.双系统估计量的交互作用偏差研究[J].数理统计与管理,2019,38(5):858-872.

[31] 杨贵军,沈文静,梁鑫宇.多目标调查的MPPS平衡抽样方法研究[J].系统科学与数学,2022,42(3):715-729.

[32] 刘晓宇,武雅萱.基于有偏误辅助变量的分层贝叶斯小域估计方法研究[J].统计与信息论坛,2024,39(8):3-15.

[33] 沈文静,杨贵军,孙玲莉.中国1%人口抽样调查的不等概率重权数Bootstrap方差估计研究[J].应用数学学报,2023,46(1):1-20.

[34] 王俊,金勇进.概率—非概率调查样本的整合推断问题研究:核匹配方法[J].统计与信息论坛,2024,39(10):3-12.

① 数据来源于https://www.stats.gov.cn/sj/sjjd/202412/t20241226_1957908.html。

基本信息:

DOI:10.20207/j.cnki.1007-3116.2025.0029

中图分类号:F424;C829.2

引用信息:

[1]沈文静,杨贵军,邸梦婷.规模以下工业调查的分层二重抽样方法研究[J].统计与信息论坛,2025,40(07):3-16.DOI:10.20207/j.cnki.1007-3116.2025.0029.

基金信息:

国家社会科学基金重大项目“新时代共同富裕实现程度的统计测度及实现路径研究”(22&ZD155)

检 索 高级检索

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文