Sqlserver2005关联规则.doc

上传人:scccc 文档编号:12529858 上传时间:2021-12-04 格式:DOC 页数:8 大小:426KB
返回 下载 相关 举报
Sqlserver2005关联规则.doc_第1页
第1页 / 共8页
Sqlserver2005关联规则.doc_第2页
第2页 / 共8页
Sqlserver2005关联规则.doc_第3页
第3页 / 共8页
Sqlserver2005关联规则.doc_第4页
第4页 / 共8页
Sqlserver2005关联规则.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《Sqlserver2005关联规则.doc》由会员分享,可在线阅读,更多相关《Sqlserver2005关联规则.doc(8页珍藏版)》请在三一文库上搜索。

1、案例背景病毒性肝炎是我国最严重和最常见的传染病之一,特别是乙型病毒性肝炎,目前我国仍有约1.2亿人持续携带乙型肝炎病毒,3千万例慢性乙肝患者中部分演变成了肝硬化,进而引发肝癌,每年死于肝炎及其并发症的患者达四十万人,医疗费用达数百亿元。所以如何预防和治疗乙型肝炎已经成为一个重要的课题,对学校每年新生入学体检乙型肝炎病毒的检验是一个重要的检查对象。目前多采用微生物学检查法,即乙型肝炎抗原、抗体检测。目前主 要用血清学方法检测 HBsAg抗HBs HBeAg抗HBe抗HBc (俗称“两对半”)。HBcAg仅存在于肝细胞内,也不用于常规检查。HBsAg的检测最为重要,可发现无症状携带者,是献血员筛选

2、的必检指标。文件迪舗辐(I) tSlE® 顶目匹)查询设计器工具宙口® 社区© 帮助(M).j新淫査询® si囹裁血aiNti釦量说禅茯晋丘血謂刮叵|更改类型j ¥呼G= 口圄三表 匚 dbo. Studeikts 摘要Xstudentjio5tudent_5ex1-EsAg抗HBsHEeAgioHBe抗二卜10506505101 H男HBsAg-HBeAg-JnMBe-KHBc-0506505102女1-BsAg-抗HBeAg-折HBe-抗仙+0506905103女HBsAg-SaHBs+HBeAg-InMBe-抗H冃t +050650510

3、4女1-EsAg-抗 HBsHBeAg-inMBe-IrLbtc-0506905105玄HBsAg-航HB$+HBeAg-JnMBe-抗HBs0506505106立l-CsAg-JtHBs*HBeAg-irtHBe-抗国亡-050650S107男FBsAa-航 HBw+HBeftg-inMBe-抗HBs0506505103男FFsAg-5tlHBs-HBeAg-抗HRe-JfiHBc-0506305109男HEsAg-抗 HBs-HBeAfl-抗HBe-抗HBs0506505110立HBsAg-HBeAg-IttHBc*Q50650&111男HBsAg抗 HBs-HBe 何-抗HBe-

4、抗HBc-CL片产亠图6-3“students”中的部分样本数据集“两对半”各项指标的意义如下: 乙型肝炎表现抗原(HBsAg):是感染了乙肝病毒的一个特异性标志。血清内HBsAg为阳性表示:急性乙肝的潜伏期和急性期; 慢性乙肝病毒感染状态, 包括无症状HBsAg携带 者、慢性乙型肝炎、与乙肝病毒有关的肝硬化和原发性肝癌。 乙型肝炎表面抗体(抗HBs):是一种保护抗体,表示曾经感染过乙肝病毒,不论临 床上有无肝炎的表现,均表示患者现已恢复,并对乙肝病毒具有免疫力;注射乙肝疫苗后, 产生抗HBs表示具有免疫力。 乙型肝炎核心抗体(抗HBc):包括抗HBc总抗体、核心抗体免疫球蛋白 M(抗HBc-

5、lgM)和核心抗体免疫球蛋白G(抗HBc-lgG)。抗HBc出现于急性乙型肝炎的急性期,恢复后可持续数年或更长,滴度则逐渐下降。慢性乙肝病毒感染者,抗HBc持续阳性。单项抗HBc阳性表示过去可能感染过乙肝病毒,其临床意义需与其他指标结合而判断。分别测抗HBc-lgM| 1/5170 1 H1 u 1 ®IH.>i m . a +t< in-.+ii in. -i和 lgG 更有意义。急性乙肝病人抗 lgM 呈高滴度阳性,特别对于 HBsAg 已转阴的病人,抗 HBc-lgM 下降的速度与患者病情相关,下降快预后好, 1 年内不降至正常或滴度高低呈反复 现象者均提示转为慢性

6、肝炎的可能。 慢性乙肝活动期抗 HBc-lgM 呈中滴度阳性, 并可区分活 动期和非活动期。抗 HBc-lgG 出现时间较迟于 HBc-lgM ,主要见于恢复期和慢性感染。(4) 乙型肝炎e抗原(HBeAg):由于HBeAg是核心抗原的成分, 其阳性和滴度常反映乙肝病毒的复制及判断传染性的强弱。急性乙肝时HBeAg呈短暂阳性,如持续阳性则提示转为慢性,在慢性乙肝病毒感染时,HBeAg阳性常表示肝细胞内有乙肝病毒活动性复制,当HBeAg转阴,伴有乙型肝炎 e抗体(抗HBe)转阳,常提示乙肝病毒停止复制。(5) 乙型肝炎e抗体(抗HBe):出现于急性乙肝的恢复期,可持续较长时间。慢性乙 肝病毒感染

7、时,如抗 HBe阳性,HBeAg常为阴性,表示乙肝病毒无明显活动性复制,传染性 较弱,临床上慢性肝病的活动性较低。从某校门诊体检系统中导出了乙肝病毒检查数据表,得到了 5170 条检验数据记录。部 分数据如图 6-3 所示(附录中提供了全部数据源 ) ,这里数据库名称为 students ,数据表名 也是 students 。6.3.2 Microsoft SQL Server 2005 Analysis Service操 作步骤类似于第三章中决策树算法的步骤,关联规则算法的具体步骤如下:1. 创建 Analysis Services 项目(1) 单击"开始” t "所有程

8、序” t “ Microsoft SQL Server 2005 ”“ SQL Server BusinessIntelligenee Development Studio ”命令,打开 Analysis Service 集成环境界面。(2) 单击菜单栏的“文件” t “新建” t “项目”命令。( 3) 选择“ Analysis Services ”项目,在“项目名称”文本框中输入“students”。( 4) 单击“确定”按钮,完成项目的创建。2. 创建数据源( 1 ) 在解决方案资源管理器中,右击“数据源”文件夹,选择“新建数据源”命令, 进入欢迎界面。( 2) 单击“下一步”按钮,进入

9、“选择如何定义连接”窗口。(3) 单击“新建”按钮,向students数据库添加连接。系统将打开“连接管理器”对话 框,在“连接管理器” 的“提供程序” 列表中, 选择“本机 OLE DBMicrosoft OLE DB Provider for SQL Server ”选项;在“服务器名称”文本框中,输入“localhost”;选择“使用 Windows身份验证”单选按钮;在“选择或输入数据库名称”列表框中,选择stude nts选项;单击“确定”按钮。( 4) 单击“下一步”按钮,进入“模拟信息”窗口,选择“默认值”单选按钮。( 5) 单击“下一步” 按钮, 进入“完成向导” 页对话框。

10、数据源的默认名称为 students。 单击“完成”即完成了数据源的创建,新的数据源stude nts将显示在解决方案资源管理器的“数据源”文件夹中。3. 创建数据源视图1 ) 在解决方案资源管理器中,右击“数据源视图”选项,选择“新建数据源视图” 命令。系统将打开数据源视图向导“选择数据源”窗口,在“关系数据源”区域下,系统将 默认选中刚才创建的stude nts数据源。(2)若要创建新数据源,单击“新建数据源”按钮,启动数据源向导;否则单击“下 一步”按钮,打开“选择表和视图”窗口。(3)选择dbo.students表,单击右箭头键,将 dbo.students包括在新数据源视图中。(4)

11、单击“下一步”按钮,进入“完成向导”对话框,默认情况下,系统将数据源视 图命名为 stude nts。(5) 单击“完成”按钮,系统将打开数据源视图设计器,显示students数据源视图。4. 创建关联规则挖掘结构(1) 在解决方案资源管理器中,右击“挖掘结构”选项并选择“新建挖掘结构” 命令, 系统将打开数据挖掘向导窗口。(2)单击“下一步”按钮,进入“选择定义方法”窗口(如果设置了不显示“欢迎使用数据挖掘向导”页面,系统将直接进入“选择定义方法”窗口。),选中“从现有关系数据库或数据仓库”选项。(3)单击“下一步”按钮,进入“选择数据挖掘技术”窗口,在“您要使用何种数据挖掘技术?”区域下,

12、选择“Microsoft关联规则”选项。(4) 单击“下一步”按钮,进入“选择数据源视图”窗口,已默认选中stude nts在数据 源视图中,单击“浏览”按钮可查看视图中各表。(5) 单击“下一步”按钮,进入“指定表类型”窗口,选中stude nts表旁边“事例”列 中的复选框。(6)单击“下一步”按钮,进入“指定定型数据”窗口,具体各复选框的选择情况如 图6-4所示。傀報掘挖握向导冋指定定型数据指定労析中所用的列.f挖扼摂型皓掏;StqI俪tw| | WsAf| |stud'entjnoJtHEc回 回回0014 UblUbJUl.JUIU1iHvam HmmBmmrBiBirBir

13、niBftHBt回0E0表例穂回筑叵可预测积一.VVV日:上-击下 完霸® RI 1 取消图6-4 “指定定型数据”页面(7)当表示某列可预测时,“建议”按钮变为可用。单击“建议”按钮打开“提供相 关列建议”对话框,“提供相关列建议”对话框按照各属性与可预测属性的相关性对其进行排序。值大于 0.05的列将被自动选中,已经包括在模型中。如果采纳这些建议,单击“确 定”按钮,便将所选列标记作为输入列,本例中不采纳建议。(8) 单击“下一步”按钮,进入“指定列的内容和数据类型”窗口。(9) 单击“检测”按钮,系统会自行确定各属性列是连续值还是离散值,“内容类型”和“数据类型”列中的各项设置

14、如图6-5所示。检测數值列的连续或离散數据:傀垃据挖幄向导匚叵冈'指定列的内容和数摇类型指定挖掘结构列的内容和数据类型:左掘模型结构W:TfTS-: g s s s ? 匸|忙上1步下一步®»|恥泊图6-5 “指定列的内容和数据类型”页面(10) 单击“下一步”按钮,进入“完成向导”对话框。(11 )在“挖掘结构名称”和“挖掘模型名称”文本框中输入“students”。(12)选中“允许钻取”复选框。6-6所示。(13)单击“完成”按钮,进入数据挖掘设计器界面,如图zxtudeii li ft D3k<ff t Vi Sual Sludi fr-|n|X|文件

15、® 範视图妁项目生成卸调试叫格式©)逊庭库给】 数据源視图椅掘複型血)工具窗口® 社区心帮助®耳 I 山*0 + 0*1 卜 I Development T 可魯 >C 匡1J TStudents. !设计* Students, dsv 设计 起始页挖掘皓构、挖掘檯型招掘桓型亘看器E1挖掘堆诵性国表=1 X Students.WO( tA- A n G e St 5 B B BB B u M H MK Hst抗抗抗=咋匚=金5j studentsEl-数据頑Siudeutz. ds-护甲丄数据睡视图 也Students, ds1 实錐數皓集Stud

16、ents, dnr角色自占椅掘皓构图6-6挖掘结构5 部署项目并处理挖掘模型单击数据挖掘设计器中的挖掘模型查看器选项卡或者按【F5】键,Analysis Services数据库将部署到服务器上,处理挖掘模型。具体操作步骤与332节中的 “6.部署项目并处理挖掘模型”相同。6 模型解释Microsoft关联规则通过其查看器来解释,Microsoft关联查看器包含三个选项卡: 项集、规则、依赖关系网络。图6-7所示的“项集”选项卡显示了关联规则算法发现的频繁项集,显示了一系列频繁 项集以及它们的支持度(发生项集的事务的数量)和大小(项集中项的数量)以及项集的实际构成。如果算法参数的最小支持度Min

17、imun_Support设置得太低,则会有许多项集。可以通过设置图6-7中最低支持度和最小项集大小来过滤这些项集,也可以通过使用“筛选项集”来过滤这些项集。例如,若要仅查看包含有关 HBeAg的项集,可在“筛选项集”中输入HbsAg 然后回车。我们将在查看器中看到,只有包含“HBsAg ”字样的项集被显示,查看器中返回的每个项集都包含有关HBsAg的信息。图6-7频繁项集图6-8所示的“规则”选项卡显示满足要求的关联规则、这些规则的概率和重要性分数。重要性分数的目的是用于测试规则的有效性。重要性分数越高,则规则的质量越好。 与项集选项卡相似,该选项卡也提供“最低支持选项”的选择。图6-8关联规

18、则在规则选项中,可以发现一些比较有价值的规则。例如:HBsAg = HBsAg+ => 抗HBs =抗HBs-。这条规则表示 HbsAg为阳性,则抗 HBs为阴性。根据医学知识可知,HbsAg为阳性时候,一般抗 HBs是不可能阳性的。如果我们想知道有多少检验结果支持该规律,则 可以使用“钻取”来快速得到支持这个规律的原始数据。关联规则查看器的第三个选项卡是“依赖关系网络”(如图6-9所示),该查看器中的每个节点表示一个项;例如, HBsAg = HBsAg+ 节点表示事务中存在 HbsAg为阳性。通过选 择节点,可以使用选项卡底部的彩色图例来确定模型中的项与其他的项的相互确定关系。滑块与

19、规则的概率关联,上下移动滑块可以筛选出强弱关联。例如,在“显示”框中, 选择“仅显示属性名称”,再单击 HBsAg = HBsAg+节点。查看器显示, HBsAg = HBsAg+ 预测了 HBeAg = HBeAg +,抗 HBs = 抗 HBs -和抗 HBc=抗 HBc+。而抗 HBe =抗 HBe+ 禾口 HBeAg = HBeAg +也预测了 HBsAg = HBsAg+。这意味着,这些项有可能同时在事务中出现。 也就是说,如果某个同学HbsAg为阳性,则HbeAg也有可能为阳性,抗 HBs是阴性的可能性比较大。顶醍1规刖床報关亲匹鉛1心心1 siki町显示1品示風性若对和備zJ r

20、埜示妆若輙在确中迭中某牛节点旦夹出床tfi壬泉.虽尧冊 口 他节姪 它貼预昂韵巧星阿它的书直.裁向卿图6-9依赖关系网络所有较强链接图6-10依赖关系网络最强的两个链接图6-9表示依赖关系网络所有较强链接,图6-10表示依赖关系网络最强的两个链接。从图6-9可以看出,该关联规则被分为两类, 一类包含HBsAg = HBsAg+,另一类包含HBsAg =HBsAg-。从图6-10可以看出所有关联规则中“HBsAg = HBsAg+ => HBeAg = HBeAg +”和“HBsAg = HBsAg-=>抗HBs =抗HBs + ”的置信度最大。这说明HBsAg是非常重要的指标, 即

21、HBsAg的检测对病毒性肝炎的诊断最为重要。由医学知识可知,HBsAg = HBsAg+表明:急性乙肝的潜伏期和急性期;慢性乙肝病毒感染状态,包括无症状HBsAg携带者、慢性乙型肝炎、与乙肝病毒有关的肝硬化和原发性肝癌。HBeAg = HBeAg +表明:肝细胞内有乙肝病毒活动性复制。该最强规则表明:当急性乙肝处于潜伏期和急性期或者慢性乙肝病毒处于 感染状态时,肝细胞内有乙肝病毒活动性复制。通过查看“规则”选项卡发现, HBsAg = HBsAg+ => HBeAg = HBeAg + 的置信度为 0.535,重要性为 3.116,由关联规则的基本原理 可以知道, 关联规则由重要性和置信度共同决定, 此最强关联规则的概率虽然不大, 但重要 性很大,说明该关联规则的关联性很强,这与临床经验相符。抗 HBs = 抗 HBs + 表明病人 有乙肝抗体;由“ HBsAg = HBsAg- => 抗 HBs =抗 HBs + ”可以看出:如果 HBsAg 显阴性, 则抗 HBs =抗 HBs + ,即病人很有可能具有抗体。由此可得, HBsAg 的检测对乙肝的诊断最为重要, 当 HBsAg 为阳性时, 病人很有可能 有乙肝病毒;当 HBsAg 为阴性时,病人很有可能有乙肝病毒抗体,这与临床经验相符。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1