关键词:
数据清洗
医保真实世界数据
纳入支付范围的药品费用
摘要:
目的:本研究聚焦医保真实世界数据的质量问题,系统构建一套医保真实世界数据清洗策略,并以国家谈判药品“纳入支付范围的药品费用”的统计为例,评估数据清洗策略的有效性。方法:以A市2024年1—9月涉及国家医保谈判准入的抗肿瘤药及免疫调节剂的医保结算原始记录数据库为研究对象,构建了包含建立校验数据集、文本结构化处理及异常值处理的数据清洗策略。以药品总费用及纳入支付范围的药品费用为效应指标,从不同人群和用药场景多维度比较分析数据清洗前后观测指标的变化。结果:数据清洗后,药品总费用保持高度稳定性(偏差<0.3%),纳入支付范围的药品费用显著下降,绝对值减少约200万元,降幅约5%。在不同人群(职工与城乡居民医保参保人)、不同用药场景(门诊、住院与零售药店以及本地与异地)呈现出不同的偏差。结论:研究验证了数据清洗策略在提升医保数据质量中的有效性,为医保真实世界数据的科学应用提供了有力支持。同时,研究揭示了医保数据质量问题的异质性分布,提示在医保数据治理过程中需关注不同人群和用药场景下的数据质量差异。未来,需进一步完善医保信息系统、强化跨平台数据系统治理,以应对医保数据治理中的系统性挑战。