应用Data Mining建置一分类模型
应用Data Mining建置一分类模型
電子商務研究,2007年春季
第五卷,第一期,頁109-124 應用Data Mining建置一分類模型
戴建耘
國立台灣師範大學工業教育學系及應用電子研究所
盧治均
國立台灣師範大學工業教育學系
廖秋惠
私立南台科技大學企業管理學系
摘要
本研究以資料挖掘(Data Mining)、資料倉儲(Data Warehouse)以及分類(Classification)演算法規則中之決策樹(Decision-Tree)為基礎之分類法做為本研究之工具,以心臟科麻醉部為例,從醫療單位對抗生素進行導管菌落判斷感染監控的歷史案例中,建構出可用以預測心靜脈導管塗抹抗生素在病患身上的作用結果之分類模式,用以協助醫藥人員有效判斷感染情形與特徵,進而提升抗生素之用藥醫療品質、降低可能的醫療資源浪費。
實驗結果顯示,本研究所收集的導管菌落判斷感染監控資料中有顯著類別間資料數量不對稱的現象,而造成模式預測偏向的問題。經由成本敏感法的運用預測錯誤成本的改善調整,提升分類預測的效能,建構出對各類別資料都有良好預測效能的理想模式。目的做為日後與專家系統之結合,發展出一套強而有力之醫療專家系統,減少醫療費用的浪費,同時在照顧病人品質方面能夠維持一定的水準。
關鍵字:資料挖掘、資料倉儲、決策樹
Applying Data Mining to Build a Classify Model
Chien-Yun Dai
National Taiwan Normal University
Chih-Chun Lu
National Taiwan Normal University
Chiu-Huin Liao
Southern Taiwan University of Technology
应用Data Mining建置一分类模型
Abstract
The research use Data Mining, Data Warehouse and Decision-Tree that Classification perform the algorithm makes for the tool. Take department that anaesthetizes pision of cardiology as an example. Build and construct out measurable Central Venous Catheter to apply in the historical case of judging Central Venous Catheter Insertion from the antibiotic and infecting Wipe the categorized model on patient of antibiotic. The paper use under-sampling, over-sampling and Part to solve skewed class distribution problem. And then use C4.5 algorithms to build up classifier. Verify via the expert that use this classifier can effectively help the medical expert to extract out it about Central Venous Catheter Insertion good knowledge rule.
Keywords: Data Mining, Data Warehouse, Decision-Tree
壹、前言
全民健保開辦之初實施論量計酬支付制度(Fee For Service, FFS)此支付制度促使醫療機構誘導醫療需求,導致醫療資源的浪費,醫療費用年年升高。健保局為了抑制醫療費用的成長,陸續的實施論病例計酬(Case Payment)、論人計酬(Capitation)、論日計酬(Per Diem)等支付制度,隨後並規劃實施了總額預算支付制度(Global Budget),使用固定的年度醫療預算總額,各醫療機構必須加強成本費用的控制,以維持其利潤。在全民健保實施後,各醫療機構為了配合醫療費用的申報,開始增加在電腦軟硬體方面的投資,各種臨床醫療行為與處方用藥也可以較完整的輸入電腦,但大多數都只為了配合健保醫療費用申報的需要。資料記錄過去的經驗,由累積在醫療資料庫中的歷史醫療紀錄,藉著資料挖掘( Data Mining)的技術,分析萃取出值得參考的現象與數據,一般被視為可以為醫療機構的經營管理帶來有用的資訊。本研究主要以Data Mining的技術,來探討其在實證醫學上的應用,藉由醫療資料庫中的資料,透過資料挖掘的演算法將資料有規則的以另一種方式呈現出來,做為提供醫療機構經營管理上的參考。
貳、文獻探討
一、資料挖掘
知識的貢獻大於資訊,資訊的貢獻大於資料,資料挖掘就是從大
应用Data Mining建置一分类模型
型的資料庫中萃取出隱藏的預測資訊,在商業上可以有效地協助企業利用資料倉儲做為預測未來的趨勢以及行為分析,也是建立企業智慧最主要的方法之一,因此有人稱之為資料庫的知識挖掘(Knowledge Discovery in Database, KDD)、資料考古學(data archaeology)或資料型態分析(data pattern analysis) (梁定澎,2004)。若能由資料中找出顯著且有用的決策模式或決策法則,進而正確地預測未來的行為,將能增加更多企業智慧,資料挖掘可以創造出許多新的知識,透過這些知識的發現、儲存、分享、利用,是重要的知識產生工具。
由此可知,資料挖掘為針對大量的資料進行處理,以發掘、萃取、得到存在於資料中有用有意義之知識,自從電腦發明之後,資料庫的建立,無疑的是日後知識經濟所必須的產物,靠著資料挖掘之技術,我們就能快速、精確的找出有用之資料,以做為支援決策使用。
關於資料挖掘的定義與研究,因不同研究者的研究重點及動機不同而有不同的看法,整理如表1所示。
表1資料挖掘的定義與研究整理表
學者(年代)資料挖掘的定義
Frawley(1991)從資料中萃取出隱藏的、先前未知的有用資訊
Gnardellis & Boutsinas(2001)認為資料挖掘為資料庫中知識發掘過程的一個步驟
Fayyad(1996)可萃取出資料中有效的、嶄新的、具潛在效益的資訊之非細瑣過程,其最終目標是瞭解資料的型態
Berry & Linoff(1997)為了發現有意義的模式或規則,以自動或半自動的方式,來勘查、分析大量資料所進行的流程
Lewis, Bernstein & Kifer (2001) 資料挖掘是一個發掘知識的過程,可以在一個大型資料集合結構中找到所需要的特徵知識
Berson, Smith & Thearling (1999) 在一個資料倉儲的數個資料倉庫中,使用「已經建立完成的統計方式」及「機器學習技術」,找尋具有相互關係、項目、趨勢預測等意義深遠的挖掘處理過程
Jiawei Han(1997) 透過許多種資料分析的技術以發掘出資料與資料之間的型態與關係的一種過程。
梁定澎(2004) 資料挖掘就是從資料中發掘知識過程,從大量資料中,找尋事前未知或有效且可以付諸行動之規則或知識
林東清(2003) 資料挖掘指的是利用統計、人工智慧(AI)或其他的分析技術,在大型資料庫(倉儲)內挖掘與尋找未知的、有效且可實行的資料間所隱藏的關係與規則,可用來支援決策支援系統
应用Data Mining建置一分类模型
綜合以上各專家學者對於「資料挖掘」的定義後,可以發現和資料庫知識發現流程(Knowledge Discovery in Database process, KDD process)有關,Fayyad(1996)認為資料庫知識發現流程是說明在資料庫中取得知識的過程,因此對於不確定、不完整及有干擾性的資料要預先處理,而資料挖掘只是資料庫知識發現流程中的一步驟。從資料庫中找尋知識,不但結合了資料庫、知識庫、而且也包括人工智慧、統計學等方面相關的應用。透過知識的挖掘,從龐大的資料庫中挖掘出有意義的資訊,以幫助決策者做最有利的決策(Berson, et al., 1997)。資料庫知識發現的流程,可包含下列幾個步驟(Fayyad,1996)。
(一)建立目標資料集合:應用先前相關知識,選擇與目標相關的資料。
(二)資料淨化與先前處理:過濾資料雜質、處理缺漏資料、定義資料
型態與綱要等。
(三)資料轉換:將資料範圍縮小 …… 此处隐藏:14287字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [法律文档]苏教版七年级语文下册第五单元教学设计
- [法律文档]向市委巡视组进点汇报材料
- [法律文档]绵阳市2018年高三物理上学期第二次月考
- [法律文档]浅析如何解决当代中国“新三座大山”的
- [法律文档]延安北过境线大桥工程防洪评价报告 -
- [法律文档]激活生成元素让数学课堂充满生机
- [法律文档]2014年春学期九年级5月教学质量检测语
- [法律文档]放射科标准及各项计1
- [法律文档]2012年广州化学中考试题和答案(原版)
- [法律文档]地球物理勘查规范
- [法律文档]《12系列建筑标准设计图集》目录
- [法律文档]2018年宁波市专技人员继续教育公需课-
- [法律文档]工会委员会工作职责
- [法律文档]2014新版外研社九年级英语上册课文(完
- [法律文档]《阅微草堂笔记》部分篇目赏析
- [法律文档]尔雅军事理论2018课后答案(南开版)
- [法律文档]储竣-13827 黑娃山沟大开挖穿越说明书
- [法律文档]《产品设计》教学大纲及课程简介
- [法律文档]电动吊篮专项施工方案 - 图文
- [法律文档]实木地板和复合地板的比较
- 探析如何提高电力系统中PLC的可靠性
- 用Excel函数快速实现体能测试成绩统计
- 教师招聘考试重点分析:班主任工作常识
- 高三历史选修一《历史上重大改革回眸》
- 2013年中山市部分职位(工种)人力资源视
- 2015年中国水溶性蛋白市场年度调研报告
- 原地踏步走与立定教学设计
- 何家弘法律英语课件_第十二课
- 海信冰箱经销商大会——齐俊强副总经理
- 犯罪心理学讲座
- 初中英语作文病句和错句修改范例
- 虚拟化群集部署计划及操作流程
- 焊接板式塔顶冷凝器设计
- 浅析语文教学中
- 结构力学——6位移法
- 天正建筑CAD制图技巧
- 中华人民共和国财政部令第57号——注册
- 赢在企业文化展厅设计的起跑线上
- 2013版物理一轮精品复习学案:实验6
- 直隶总督署简介




