糖尿病犯者醫(yī)療管理研究

時(shí)間:2022-11-15 09:16:38

導(dǎo)語(yǔ):糖尿病犯者醫(yī)療管理研究一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

糖尿病犯者醫(yī)療管理研究

近十年來(lái),我們面臨快速增長(zhǎng)糖尿病患者人數(shù),患者人群也成為了公共健康最為沉重的負(fù)擔(dān)之一。2000年,所有年齡層的糖尿病患病率達(dá)2.8%,預(yù)計(jì)到2030年該數(shù)據(jù)將達(dá)到4.4%[1]。2000年,因糖尿病導(dǎo)致的全球過(guò)量死亡率預(yù)計(jì)達(dá)到290萬(wàn)人,相當(dāng)于全年死亡人數(shù)的5.2%[2]。伴隨著不同的并發(fā)癥,糖尿病對(duì)個(gè)人生活質(zhì)量以及醫(yī)療資源的使用造成了相當(dāng)大的影響。預(yù)先血糖控制可以減緩或防止糖尿病并發(fā)癥的發(fā)生。一般來(lái)說(shuō),糖尿病患者的保健質(zhì)量通過(guò)血紅蛋白A1C來(lái)評(píng)估。

1資料與方法

1.1分類算法及效果評(píng)估。為比較屬性選擇的效果,需要利用三種分類算法測(cè)試屬集:一個(gè)以樣例為基礎(chǔ)的學(xué)習(xí)法KNN,一個(gè)決策樹(shù)學(xué)習(xí)法C4.5,還有一個(gè)概率學(xué)學(xué)習(xí)法樸素貝葉斯分類法(NaïveBayesclassifier)。KNN是以樣例為基礎(chǔ)學(xué)習(xí)法的一個(gè)例子,列舉一個(gè)新的例子,KNN算法給最相似的一個(gè)或多個(gè)樣例分配類別。根據(jù)樣例間的差距計(jì)算相似度。本研究中,我們使用的分類精度和受試者工作特征曲線下的區(qū)域(藥時(shí)曲線下面積)評(píng)估分析模型的效果[3]。分類精度的研究原則,是使用最為普遍的原則。藥時(shí)曲線下面積有著重要的數(shù)據(jù)特性。一個(gè)模型的藥時(shí)曲線相當(dāng)于概率,無(wú)論該模型中隨機(jī)選取正樣例的級(jí)別是否高于隨機(jī)所選負(fù)樣例[4]。一般而言,面積越大,模型越好。1.2數(shù)據(jù)描述。本研究使用的臨床數(shù)據(jù)庫(kù)來(lái)自于臺(tái)灣中部的一家醫(yī)學(xué)院附屬醫(yī)院,該院擁有110名醫(yī)生、600個(gè)床位,以及每年60000件的門診服務(wù)和10000件的住院服務(wù)。該數(shù)據(jù)集中有1498個(gè)樣例。本研究收集的特征包括連續(xù)數(shù)據(jù),如年齡、發(fā)病期、身體質(zhì)量指數(shù)(BMI);分類數(shù)據(jù),如性別、受教育程度、家庭病史、定期鍛煉、日常飲酒、吸煙、自我護(hù)理、共病、血糖檢測(cè)使用情況、治療情況。ICD-9診斷碼,共病分為五類:腎臟并發(fā)癥、眼部并發(fā)癥、神經(jīng)系統(tǒng)并發(fā)癥、血管并發(fā)癥以及足部并發(fā)癥。治療方法分為三類,包括飲食控制、口服液以及胰島素注射。決策屬性A1C分為兩個(gè)級(jí)別:認(rèn)為A1C<9.0%是做到了良好的血糖控制;認(rèn)為A1C≥9.0%是血糖控制非常不理想[5]。

2研究結(jié)果分析

實(shí)驗(yàn)中使用的血糖控制數(shù)據(jù)。通過(guò)使用信息增益、增益率、對(duì)稱不確定性以及ReliefF評(píng)級(jí)算法的整套數(shù)據(jù)確定特征評(píng)級(jí)。數(shù)據(jù)集里使用三個(gè)連續(xù)特征,十個(gè)分類特征。四種特征評(píng)級(jí)方法提供不同的級(jí)別,明顯地生產(chǎn)不同的分類效果。血糖控制前五個(gè)重要特征是年齡、治療方式、自我護(hù)理?xiàng)l件、受教育程度以及定期鍛煉。C4.5分類法,KNN(k=1),樸素貝葉斯用于測(cè)試分類盒藥時(shí)曲線下面積。我們使用十倍的交叉效度分析作為標(biāo)準(zhǔn),預(yù)測(cè)帶有固定數(shù)據(jù)樣本的學(xué)習(xí)法分類法的準(zhǔn)確性和藥時(shí)曲線下面積。通過(guò)使用四種特征評(píng)級(jí)方法比較C4.5的分類準(zhǔn)確性,使用五個(gè)和六個(gè)特征的ReliefF評(píng)級(jí)算法獲得最佳的分類準(zhǔn)確性為73.56%。KNN分類法中,使用四個(gè)特征的ReliefF評(píng)級(jí)算法獲得的最佳分類準(zhǔn)確性為73.56%。NB分類法中,使用五個(gè)特征的IG、GR、SU算法獲得的最佳分類準(zhǔn)確性為74.10%。與C4.5和KNN分類法相比,NB獲得的準(zhǔn)確性比C4.5和KNN模型更好。通過(guò)使用四種特征評(píng)級(jí)方式比較C4.5的藥時(shí)曲線下面積,采用七種特征的ReliefF的評(píng)級(jí)算法獲得最大的面積為6199。KNN分類法中,使用五個(gè)特征的ReliefF評(píng)級(jí)算法獲得的最大藥時(shí)曲線下面積為6251。NB分類法中,使用五個(gè)特征的IG、GR、SU算法獲得的最大藥時(shí)曲線下面積為6553。與C4.5和KNN分類法的藥時(shí)曲線下面積相比,NB獲得的準(zhǔn)確性比C4.5和KNN模型更好。本研究意在探究血糖控制特征的評(píng)級(jí),以及使用不同的分級(jí)法探究四種特性評(píng)級(jí)方法的效果。我們提出四種特征評(píng)級(jí)方法的一個(gè)對(duì)照,生成特性評(píng)級(jí)列表。結(jié)果顯示,特征選擇有利于改善常見(jiàn)學(xué)習(xí)法算法。研究表明,任何學(xué)習(xí)分類法都不能完美地處理所有情況。研究表明NB分類法和藥時(shí)曲線下面積要比C4.5和KNN分類法和藥時(shí)曲線下面積有更高的優(yōu)越性。C4.5和KNN、ReliefF評(píng)級(jí)算法可以獲得最佳的準(zhǔn)確性和最大藥時(shí)曲線下面積;NB、IG、GR、SU則獲得同樣的準(zhǔn)確性和藥時(shí)曲線下面積。

本論文得出的結(jié)論對(duì)特征評(píng)級(jí)方法以及學(xué)習(xí)法算法有著重要的影響。其他特征選擇方式以及分類法模型能有益于將來(lái)的研究提高準(zhǔn)確性和藥時(shí)曲線下面積。

作者:翁景德 唐維萍 許哲毓 單位:1.仰恩大學(xué) 2.華廈學(xué)院