教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 精品文档 > 法律文档 >

应用Data Mining建置一分类模型

来源:网络收集 时间:2026-01-24
导读: 应用Data Mining建置一分类模型 電子商務研究,2007年春季 第五卷,第一期,頁109-124 應用Data Mining建置一分類模型 戴建耘 國立台灣師範大學工業教育學系及應用電子研究所 盧治均 國立台灣師範大學工業教育學系 廖秋惠 私立南台科技大學企業管理學系 摘要

应用Data Mining建置一分类模型

電子商務研究,2007年春季

第五卷,第一期,頁109-124 應用Data Mining建置一分類模型

戴建耘

國立台灣師範大學工業教育學系及應用電子研究所

盧治均

國立台灣師範大學工業教育學系

廖秋惠

私立南台科技大學企業管理學系

摘要

本研究以資料挖掘(Data Mining)、資料倉儲(Data Warehouse)以及分類(Classification)演算法規則中之決策樹(Decision-Tree)為基礎之分類法做為本研究之工具,以心臟科麻醉部為例,從醫療單位對抗生素進行導管菌落判斷感染監控的歷史案例中,建構出可用以預測心靜脈導管塗抹抗生素在病患身上的作用結果之分類模式,用以協助醫藥人員有效判斷感染情形與特徵,進而提升抗生素之用藥醫療品質、降低可能的醫療資源浪費。

實驗結果顯示,本研究所收集的導管菌落判斷感染監控資料中有顯著類別間資料數量不對稱的現象,而造成模式預測偏向的問題。經由成本敏感法的運用預測錯誤成本的改善調整,提升分類預測的效能,建構出對各類別資料都有良好預測效能的理想模式。目的做為日後與專家系統之結合,發展出一套強而有力之醫療專家系統,減少醫療費用的浪費,同時在照顧病人品質方面能夠維持一定的水準。

關鍵字:資料挖掘、資料倉儲、決策樹

Applying Data Mining to Build a Classify Model

Chien-Yun Dai

National Taiwan Normal University

Chih-Chun Lu

National Taiwan Normal University

Chiu-Huin Liao

Southern Taiwan University of Technology

应用Data Mining建置一分类模型

Abstract

The research use Data Mining, Data Warehouse and Decision-Tree that Classification perform the algorithm makes for the tool. Take department that anaesthetizes pision of cardiology as an example. Build and construct out measurable Central Venous Catheter to apply in the historical case of judging Central Venous Catheter Insertion from the antibiotic and infecting Wipe the categorized model on patient of antibiotic. The paper use under-sampling, over-sampling and Part to solve skewed class distribution problem. And then use C4.5 algorithms to build up classifier. Verify via the expert that use this classifier can effectively help the medical expert to extract out it about Central Venous Catheter Insertion good knowledge rule.

Keywords: Data Mining, Data Warehouse, Decision-Tree

壹、前言

全民健保開辦之初實施論量計酬支付制度(Fee For Service, FFS)此支付制度促使醫療機構誘導醫療需求,導致醫療資源的浪費,醫療費用年年升高。健保局為了抑制醫療費用的成長,陸續的實施論病例計酬(Case Payment)、論人計酬(Capitation)、論日計酬(Per Diem)等支付制度,隨後並規劃實施了總額預算支付制度(Global Budget),使用固定的年度醫療預算總額,各醫療機構必須加強成本費用的控制,以維持其利潤。在全民健保實施後,各醫療機構為了配合醫療費用的申報,開始增加在電腦軟硬體方面的投資,各種臨床醫療行為與處方用藥也可以較完整的輸入電腦,但大多數都只為了配合健保醫療費用申報的需要。資料記錄過去的經驗,由累積在醫療資料庫中的歷史醫療紀錄,藉著資料挖掘( Data Mining)的技術,分析萃取出值得參考的現象與數據,一般被視為可以為醫療機構的經營管理帶來有用的資訊。本研究主要以Data Mining的技術,來探討其在實證醫學上的應用,藉由醫療資料庫中的資料,透過資料挖掘的演算法將資料有規則的以另一種方式呈現出來,做為提供醫療機構經營管理上的參考。

貳、文獻探討

一、資料挖掘

知識的貢獻大於資訊,資訊的貢獻大於資料,資料挖掘就是從大

应用Data Mining建置一分类模型

型的資料庫中萃取出隱藏的預測資訊,在商業上可以有效地協助企業利用資料倉儲做為預測未來的趨勢以及行為分析,也是建立企業智慧最主要的方法之一,因此有人稱之為資料庫的知識挖掘(Knowledge Discovery in Database, KDD)、資料考古學(data archaeology)或資料型態分析(data pattern analysis) (梁定澎,2004)。若能由資料中找出顯著且有用的決策模式或決策法則,進而正確地預測未來的行為,將能增加更多企業智慧,資料挖掘可以創造出許多新的知識,透過這些知識的發現、儲存、分享、利用,是重要的知識產生工具。

由此可知,資料挖掘為針對大量的資料進行處理,以發掘、萃取、得到存在於資料中有用有意義之知識,自從電腦發明之後,資料庫的建立,無疑的是日後知識經濟所必須的產物,靠著資料挖掘之技術,我們就能快速、精確的找出有用之資料,以做為支援決策使用。

關於資料挖掘的定義與研究,因不同研究者的研究重點及動機不同而有不同的看法,整理如表1所示。

表1資料挖掘的定義與研究整理表

學者(年代)資料挖掘的定義

Frawley(1991)從資料中萃取出隱藏的、先前未知的有用資訊

Gnardellis & Boutsinas(2001)認為資料挖掘為資料庫中知識發掘過程的一個步驟

Fayyad(1996)可萃取出資料中有效的、嶄新的、具潛在效益的資訊之非細瑣過程,其最終目標是瞭解資料的型態

Berry & Linoff(1997)為了發現有意義的模式或規則,以自動或半自動的方式,來勘查、分析大量資料所進行的流程

Lewis, Bernstein & Kifer (2001) 資料挖掘是一個發掘知識的過程,可以在一個大型資料集合結構中找到所需要的特徵知識

Berson, Smith & Thearling (1999) 在一個資料倉儲的數個資料倉庫中,使用「已經建立完成的統計方式」及「機器學習技術」,找尋具有相互關係、項目、趨勢預測等意義深遠的挖掘處理過程

Jiawei Han(1997) 透過許多種資料分析的技術以發掘出資料與資料之間的型態與關係的一種過程。

梁定澎(2004) 資料挖掘就是從資料中發掘知識過程,從大量資料中,找尋事前未知或有效且可以付諸行動之規則或知識

林東清(2003) 資料挖掘指的是利用統計、人工智慧(AI)或其他的分析技術,在大型資料庫(倉儲)內挖掘與尋找未知的、有效且可實行的資料間所隱藏的關係與規則,可用來支援決策支援系統

应用Data Mining建置一分类模型

綜合以上各專家學者對於「資料挖掘」的定義後,可以發現和資料庫知識發現流程(Knowledge Discovery in Database process, KDD process)有關,Fayyad(1996)認為資料庫知識發現流程是說明在資料庫中取得知識的過程,因此對於不確定、不完整及有干擾性的資料要預先處理,而資料挖掘只是資料庫知識發現流程中的一步驟。從資料庫中找尋知識,不但結合了資料庫、知識庫、而且也包括人工智慧、統計學等方面相關的應用。透過知識的挖掘,從龐大的資料庫中挖掘出有意義的資訊,以幫助決策者做最有利的決策(Berson, et al., 1997)。資料庫知識發現的流程,可包含下列幾個步驟(Fayyad,1996)。

(一)建立目標資料集合:應用先前相關知識,選擇與目標相關的資料。

(二)資料淨化與先前處理:過濾資料雜質、處理缺漏資料、定義資料

型態與綱要等。

(三)資料轉換:將資料範圍縮小 …… 此处隐藏:14287字,全部文档内容请下载后查看。喜欢就下载吧 ……

应用Data Mining建置一分类模型.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wendang/1418635.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)