政府信息公开
政  策
  • 规章
  • 行政规范性文件
    • 政府规范性文件
    • 部门规范性文件
  • 政府文件
  • 部门文件
  • 历史文件

傅勇:利用大数据改进CPI调查方法的几点思考

来源: 国家统计局 发布时间:2019-07-30 16:35 浏览次数: 字体: [ ] 收藏 打印

现行的CPI方法制度在很长一段时期内,特别是居民消费品数量、品种相对较少的计划经济时代,有其科学性、合理性,源头数据采集准确性是能够保证的。但随着经济社会的快速发展和物质商品和服务项目的日益丰富,居民消费商品的数量不断增加,品种不断增多,变化不断增强,现行CPI方法制度在调查实践中难以适应社会经济发展需求。突出表现是:应对复杂多变的消费品市场,人工抽选有代表性的规格品难度越来越大,采价员常常无法取得实际成交价,人工采价成本越来越高等。在信息技术大爆炸时代,大数据的运用与开发,给改进和优化CPI调查方法制度提供了前所未有的机遇。

一、与CPI调查密切相关的大数据

目前,可供宏观价格水平测度的大数据主要包括:行政记录、互联网数据(主要是网购价格和记录)和实体零售单位的电子扫描数据(商场、超市、医院、药店、中介等电子扫描数据,或称电子交易数据)。

网络价格数据虽然是大数据的一种形式,但完全利用网络价格编制价格指数应持谨慎态度,其主要原因:一是网络挂牌价有的并非是成交价;二是网络购物虽发展很快但总体占比还是偏小;三是网络抓取数据技术复杂;四是大量获取数据和清洗数据的成本高昂。因此,编制一整套网络价格指数替代或合成现有的居民消费价格指数并不符合实际。现行方案是按照居民网购消费比例,选取部分有代表性的商品作为CPI调查规格品进行网络采价,切实可行。

CPI调查中涉及的行政记录主要是指政府及相关部门以文件、公告等形式明确的商品价格记录,例如:水、电、燃气、公交票等价格。此类价格数据相对稳定,且采集方便,按现行的制度执行比较科学合理。

作为大数据之一的电子扫描数据具有结构化数据特征,能够在非常详细的级别上显示出包括销售量、相应价值总额和消费品单价等信息,是一种新的统计数据来源,在CPI编制中优势明显。这类数据存于商业企业(单位)电子数据库,且大多数居民消费品成交量和成交价格包含其中。在现行居民消费价格调查项目262个基本分类中,除40多个服务项目暂不具备条件应用扫描数据进行抽样外,有83%的调查项目都具备条件应用扫描数据进行抽样和采价。

因此,电子扫描数据应用,最终会对CPI调查价格的采集方式以及指数编制方式产生重大影响,是大数据在CPI调查工作中应用的重点,也是改良CPI抽样调查方法的必由之路。

二、江西利用大数据改进CPI方法的有益尝试

为向互联网要效率,向大数据要质量,促进CPI调查工作换发出新的活力,江西消价调查系统积极推进大数据应用,改进CPI调查方法,取得了一定进展。

近年来,江西已经直接将网购数据纳入部分CPI调查规格品的采价范围。2019年,在前期试点基础上,江西消价调查系统重点做好四项工作:一是制定目标。为推动大数据的运用,江西总队制定了近、中、远三期目标,近期目标是取得部分商业单位电子扫描数据,应用电子扫描数据评估人工采价质量,建立规格品备选目录,研判价格走势、扩大网络采价共享的范围等;中期目标是建立连续的大数据资料库,建立完备的调查网点和规格品抽样框,用概率抽样技术选取规格品,增强规格品代表性;远期目标实现定期获取抽中规格品的价格、销量等资料,用大数据代替大部分人工采价。二是加强协调。积极推动基层调查队通过填报v203电子表、协调商超、走访中介等方式,力求在商场超市、中介、医院、药店等调查网点取得电子数据,力争在电子扫描数据采集上取得突破,并将部分电子数据直接纳入CPI计算。三是推进网采。即根据居民消费习惯,及时调整网络采价规格品的比重。据住户调查资料显示,居民选择网络购物的比重逐年增加,为使居民消费价格调查样本结构与居民消费习惯一致,提高调查代表性,全省已将网络采价比重提高至13%。四是深入研究。调动全省消价调查系统在实践基础上,围绕“大数据背景下如何改进CPI调查方法”等问题展开方法制度研究。市县调查队选择1-2个方向,从小处着手,以问题为导向,展开调查研究。总队结合各地实际,加强统筹指导。在此基础上,总队展开以《大数据背景下扫描数据在编制CPI中的应用问题研究》为题的课题研究。

目前,江西262个CPI调查基本分类中约35%已经涉及网络采价。目前已有11个市级调查队、5个县级调查队连续获取电子数据,涉及采价点共87家,其中商超24家,药店22家,医院18家,家电销售店、服装店、房屋租赁公司各7家,旅行社、书店各1家。部分调查队已经取得一家商超全部、连续的交易电子数据料,正协商新增1-2家商超提供电子扫描数据。部分市县调查队已实现电子商超数据应用的近期目标,还有部分调查队已经将医院、药店等电子交易数据直接纳入CPI计算。省会城市南昌正尝试向中期目标冲击。有关改进方法制度调研分析报告陆续完成,部分已经被国家局内网采用。

从全国情况看,为适应新时代的要求,部分省份先行先试、积极探索,大数据应用步伐较快,对传统的CPI调查方法进行改革,在许多领域取得了积极进展。相比之下,江西利用大数据改进CPI调查方法的步伐还不够快,成效不够明显。

三、利用大数据改进CPI调查方法的几点思考

经过一段时间的尝试和总结,笔者认为利用大数据改进CPI调查方法的重点应该是:如何利用电子扫描数据提高CPI调查规格品的代表性、准确采集选中规格品的交易价格以及提高调查效率。总体思路应该是:建框抽样,网上直报,即:利用电子扫描数据建立抽样框,计算权数,按照科学的抽样方法(例如概率抽样)抽取调查规格品,由被调查单位网上直报抽中规格品交易价格,需更换规格品时可利用抽样框选择“同质可比”的商品。为此今后要重点做好以下几项工作:

一是制定适应电子扫描数据应用的CPI调查流程。在研究应用实践的基础上,制定具体构建抽样框、样本抽取、样本轮换、规格品替换及插补、质量调整(即对特征随时间发生变化的产品价格进行的调整)、权数的修正、数据的汇总、数据的核查等方面的操作流程规定。例如:可利用规格品样本框中包含的大量基础价格数据,运用相关模型进行CPI调查质量调整,并以制度的形式对质量调整工作形成刚性约束,定期上报调整项目价格变化,报告所用的调整方法,调整人员,审批人等,明确质量调整工作的权限及职责。

二是在制度层面明确应用电子扫描数据采价。现行的《流通和消费价格统计报表制度》规定:在保证价格准确的前提下,经国家统计局审定,各地可通过相关政府部门发布的通知、公告等文件,以及部分企业、单位公开发布的收费信息资料和被调查单位的电子数据进行辅助采价,也可从互联网采集特定商品和服务价格。规定中“辅助采价”提法不利于大数据在CPI调查中的应用,应当将“被调查单位的电子数据进行辅助采价”修改为:被抽中的调查单位按制度要求及时报送有关电子交易数据。农贸市场等暂不具备电子上报条件的,进行人工采价。

三是借助经济普查建立CPI调查抽样框。目前推进大数据在CPI调查中的应用的难点之一是:被调查企业不理解,不配合,不愿提供电子扫描数据。而我国周期性的经济普查是充分发挥国家行政动员力优势的国家统计调查行动。可利用经济普查构建实体商户的抽样框,并向实体商户采集一定时期内所有商品交易价格信息,建立规格品抽样框。并根据对两个抽样框进行数据清洗,以满足利用概率抽样方法抽取实体商户样本和有代表性的规格品样本的需要。

四是运用概率抽样选取调查规格品。在抽样框完善的基础上,组织力量根据概率抽样原理抽取有代表性的实体调查商户,在抽中的商户内按照概率抽样原理抽取有代表性的规格品,解决现行调查中非概率抽样代表性不足问题。在此基础上建立样本轮换制度,按照CPI基期五年轮换一次要求,每年轮换一定比例的商户,五年全部轮换完,这无论从CPI编制的要求和均衡商户回答负担来看,都是很好的选择。由于将人工采价方式改为电子数据直报方式,为提高规格品代表性,可以大幅增加规格品样本数量。需要强调的是,为减轻企业负担,每月只向统计部门上报抽中规格品交易价格数据,而不是全部。

五是将CPI调查纳入全国网上直报平台。国家统计局应用现代信息技术在全国建立了“企业联网直报平台”。目前,全国包括限额以上商业企业在内的40多万企业通过联网直报平台报送数据。应研究在“企业联网直报平台”中增加CPI调查数据直报平台,条件成熟时,由商场、超市、医院、中介等单位每月向统计部门直接上报CPI调查所需的电子交易数据。各级统计机构在统一平台上按权限处理数据。此平台设计数据清洗、构建抽样框、选取代表规格品、规格品缺失替换或插补、质量调整、数据汇总等功能操作。

扫一扫在手机打开当前页

主办:雅安市人民政府办公室    承办:雅安市人民政府办公室电子政务科  

政府网站标识码5118000022    川公网安备51180202511865    蜀ICP备13021309号-1