前言:寻找写作灵感?中文期刊网用心挑选的医院档案信息管理关键技术探究,希望能为您的阅读和创作带来灵感,欢迎大家阅读并分享。
摘要:医院档案信息管理对于医院运营管理而言至关重要。为探寻医院档案信息管理技术,此次研究使用WEKA(Waika-toEnvironmentforKnowledgeAnalysis)环境的线性回归分析和K-means聚类算法等数据挖掘技术,从数据仓库中提取出更能体现医院价值取向的绩效管理模型,最终得到的绩效管理模型分为工作量绩效模型和科室扶持模型,其中各科室工作量模型相关系数均大于0.5,扶持模型将科室依据工作环境分为6个类簇。回归模型拟合性良好,聚类结果与医院实际情况较为符合,可以认为基于数据挖掘技术的综合绩效模型具有一定的实用价值。
关键词:档案信息;数据挖掘;绩效模型;线性回归;K-means
0引言
随着医疗行业的信息化发展,医院档案信息系统中储存着越来越多的各类数据。采用数据挖掘对冗杂数据进行有效管理,并从中提取出有价值的信息,能够帮助管理层进行决策,实现信息价值最大化[1]。医院绩效模型大多为profit×factor,即利润与主观系数之积[2]。单纯用利润作为绩效考核的依据会打击工作量大、工作难度高但利润低科室医务工作者的积极性,以工作量作为绩效考核依据更具有客观性与普适性[3]。在此基础上,对具有利润微薄、技术含量高、工作环境差等特殊情况的科室进行额外奖金补贴,能够充分调动医护工作者工作积极性。基于此,此次研究对医院档案信息进行数据挖掘,旨在从工作量和额外补贴两方面入手,构建更合理的医院绩效管理模型。
1医院档案信息数据挖掘绩效管理
1.1工作量绩效线性回归数据挖掘模型。此次研究中医院档案信息管理数据挖掘模型的设计考虑用工作量代替收入来构建绩效模型,采用新模型得出的应付奖金总数需要与历史水平相近。医生工作量可以从HIS(HospitalInformationSystem)系统的项目开单和病案管理系统中获得。根据卫健委最新规定,医生绩效评测不允许使用开单数量作为依据[4]。为合理评测医生工作量,将绩效分为医疗项目绩效与治疗患者数绩效,前者占70%,后者占30%。RBRVS是综合考虑医疗资源消耗与不同手术相对价值的医生薪酬计算方式,这种计算方式在欧美地区得到了广泛的应用[5]。此次研究采用RBRVS点数对工作量进行评估,利用不同执行项目的RBRVS点数计算医疗项目绩效。为便于绩效模型的奖金控制,采用一元线性回归建立不同科室的绩效模型。以每个科室单一月度的项目点数作为自变量,将该科室该月度实发绩效奖金的70%作为因变量,使用WEKA进行一元线性回归方程拟合,获得方程的斜率与截距。采取相同的方式对治疗患者数绩效进行线性回归分析,合并两项得到最终的绩效模型方程。为在既有绩效管理系统中实现数据挖掘,使用WEKA智能分析环境进行内部集成,通过在Java中导入WEKA,并进行接口调用。首先进行顺序图设计,在服务层获取数据仓库fact层中的项目点数、病案数据和历史奖金表单,将上述表单转化为List格式的数据库访问对象集合,如图1所示。业务逻辑层对服务层数据进行调用,并获得项目点数、病案数据和历史奖金三项数据库访问对象信息,然后利用服务层进行逻辑变化与组合对Arff文件进行生成。最后将Arff格式分发给线性回归模型转换类,将其转换为线性回归模型,并返回到业务逻辑层。然后对回归模型进行类图设计。类图包含OrgSummaryDao、OrgSummaryService、ISer-vice等类包。将员工编号设为维度表主键,其余事实信息保存为数值格式或日期格式。由于服务层获取了Fact层的ResultSet,并将其改为了数据库访问对象,因此可以在服务层中提取出定义了QueryHelper的接口,用于对数据库进行编辑操作。业务层需要的服务如表1所示。其对应的数据信息分别为医疗质量、科室的业务和工作量RBRVS值。使用线性回归模型转换器进行Arff形式的模型构建,最后得出了slope与intercept属性。将slope与intercept属性汇总,得到每个科室的绩效线性回归方程。
1.2科室扶持K-means聚类数据挖掘模型。对两千多名中国医生进行薪酬收入与工作量匹配度调查[6],结果如图2所示。医院各大科室中公认最累、压力最大的部分科室中,急诊科的薪资仅超过平均线0.85万元,而儿科薪酬甚至没有达到各科室的平均标准[7]。考虑到部分科室的工作环境较为苛刻,工作压力较大,单纯以工作量计算绩效依然具有一定的片面性[8]。为深化医院绩效模式的改革,可以从学科价值、劳动强度、技术含量、精神压力、职业伤害等多角度入手,建立科室扶持模型,对工作量绩效模型进行进一步修正,以提升绩效模型的合理性。为建立科室扶持模型,要先对不同科室的工作内容和工作环境等因素进行分析,将科室分为不同的扶持等级,并根据不同的扶持等级设定不同的奖金计算方法。采用K-means算法对医生与护士的科室进行主观和客观的评价,对不同科室与医护类别进行分析。以护士评价为例,结合护士工作中各项因素,获得包含10个参数的科室扶持属性。其中噪音污染、职业风险、技术难度、生理劳累、职业伤害、职业暴露、硬件环境、心理劳累8项因素采取专家评分的方式进行评价。用药收入、急诊人数等数据信息从HIS系统中调取。将专家评分意见与所需的HIS系统数据进行合并,即可形成该科室护理人员的科室扶持属性,对各科室的科室扶持属性进行聚类分析,以获得不同科室的扶持等级。基于WEKA的K-means聚类模型构建方法与一元回归模型类似,由NurseClassifyBusiness生成Arff形式的WE-KAK-means数据,再将Arff文件传递给K-means模型转换器,调用WEKA的API文件,使其转换为K-means模型。
2数据挖掘结果分析
2.1工作量绩效模型。选取某医院2018年12月至2019年9月各科室各月项目绩效、接待患者人数与对应实发绩效奖金数据,应用于WEKA一元线性回归模型,分别建立各科室项目绩效回归方程与接待患者人数回归方程,并合并为该科室的工作量绩效模型回归方程。某科室项目绩效回归分析图,如图3所示。从图3中可以看出该科室的月项目点数与70%绩效奖金大致呈线性分布,且各月数据散点均匀分布在拟合线两侧。由回归拟合可以看出,该科室的项目绩效方程为y=11.279x-13670,其中y表示70%绩效奖金/元,x表示当月该科室项目点数。R2为0.9404,即该回归分析拟合程度较高。在如图3所示项目点数回归分析的基础上继续计算患者人数回归方程,并推广到医院的12个主要科室,得到12条工作量绩效一元线性回归曲线,如图4所示。当相关系数取值介于0.5到1时,认为该科室工作量绩效模型合理。这12个科室中线性回归模型相关系数最低的是骨科,其相关系数为0.51。相关系数最高的是神经外科,其相关系数达到了0.84。因此可以认为这些科室的工作量绩效一元线性回归模型较为合理。运用全院所有科室综合数据,将医院作为一个整体进行工作量绩效一元线性回归分析。最终获得的回归方程为y=4.83x+490703.88,其中y表示绩效奖金/元,x表示当月全院工作量。全院工作量一元线性回归方程相关系数为0.88,可以看出医院整体工作量与绩效大致呈线性关系,采用一元回归分析进行工作量绩效拟合适用性较高。
2.2科室扶持模型使用。K-means模型对护士环境进行扶持等级聚类分析,使用同簇距离来对聚类结果进行评价。通过对seed值的调整,发现seed值取139时能够得到最短的同簇距离,此时同簇距离为82.582。使用WEKA中seed取139的K-means聚类算法,通过对工作强度、技术难度、硬件条件、工作环境、工作压力等指标进行聚类,得出聚类结果如表2所示。表2显示的类簇中包含的一系列科室具有相似的工作强度、技术难度、硬件条件、工作环境与工作压力。神经外科、心外科和新生儿监护中心是各大医院压力最大的科室,其中神经外科与新生儿监护中心工作强度与工作压力极大。呼吸内科、放疗科和感染性疾病科工作强度也较高,且这些科室的职业暴露和职业伤害情况也较为严重。类簇5中科室的工作强度弱于类簇1和类簇4,且其工作环境相较于类簇1和类簇4的科室更加优越。在实际扶持等级绩效奖金的制定中,应优先考虑类簇1和类簇4所包含的科室,而类簇5的科室应给予相对更少的奖金。
3总结
医院规模的扩张加剧了医院档案信息管理的难度,运用计算机技术手段对医院档案信息进行现代化管理能够大幅提升医院档案信息管理效率。为探究医院档案信息管理技术,此次研究以WEKA工具的调用为基础,基于医院历史绩效设计了新的绩效模型。运用一元回归分析构建了包含项目工作量点数和接待患者数的工作量绩效模型,并运用K-means算法构建了科室扶持聚类模型。获得的全院整体工作量绩效回归模型相关系数达到了0.88,各科室分别的相关系数分布在0.51至0.84间,证明了工作量模型拟合效果较好。科室扶持聚类模型依照不同的工作环境将科室分为6组,其中工作压力较大的科室为一组,工作环境较优越的科室为一组,面临职业风险的科室为一组,分组情况与实际情况较为吻合。因此可以认为数据挖掘技术在医院档案信息管理中具有较强的实际应用价值。此次研究中工作量绩效回归模型的项目点数部分采用的评测方式是基于美国医生工作情况设计的RBRVS点数,与国内情况可能存在一定程度上的差异。在今后的工作中,可以通过对RBRVS点数的修正以改进工作量绩效回归模型。
作者:李娣 单位:安阳市人民医院