关键词:
医学影像
大数据技术
HBase数据库
性能优化
摘要:
子宫肌瘤是妇科最常见的肿瘤之一,子宫肌瘤疾病主要影响30至50岁的女性,现在存在着患病率高、数据量大等情况,在大数据时代信息科技蓬勃发展下,医学影像技术、医院信息管理模式、医疗科研模式也随之发生迭代升级进步。不能只是停留在机械式的、低效率的医疗数据检索、医疗影像科研模式利用率不理想,关于子宫肌瘤的影像科研数据平台也是属于缺失状态,数据未能实现互联互通,存在数据孤岛情况,为帮助医学研究和治疗人员更便利开展子宫肌瘤方面的研究,所以开展子宫肌瘤影像科研数据层面设计和研究十分必要。子宫肌瘤影像科研数据平台为开展医学研究工作提供助力,也节省了诸多时间和人力成本。
本文旨在探讨子宫肌瘤影像科研数据平台的数据层面,借助大数据相关技术展开研究和设计工作:
(1)从平台涉及的相关专业知识出发,着手介绍大数据中Hadoop生态圈的三大组件的原理,并阐述HBase非结构化数据库的架构和基本原理。
(2)从无到有的过程,利用上述组件和技术具体开展关于子宫肌瘤影像科研数据平台的数据层面的设计和研究,阐述DICOM影像文件的具体结构,从可行性分析和功能模块分析着手,进行相关设计和运用,如用例图、数据表等内容,进而实现平台的数据层面的设计与实现。
(3)从有到优的过程,对子宫肌瘤影像科研数据平台数据层面进行高性能优化工作的研究,在基于HBase表的设立,用两种优化方式:添加布隆过滤器和二级索引的优化,综合优化降低检索时间,提高查找数据效率,并进行实验,验证检索均有不同程度的优化。
本文研究和设计内容也为后续开展子宫肌瘤影像科研数据平台的研究提供基础和思路,如人工智能医学模块的研究、性能优化中的存储优化工作、子宫肌瘤影像科研数据的安全共享的设计和研究。