关联分析--SPSS例析.docx

上传人:scccc 文档编号:14418797 上传时间:2022-02-05 格式:DOCX 页数:11 大小:311.69KB
返回 下载 相关 举报
关联分析--SPSS例析.docx_第1页
第1页 / 共11页
关联分析--SPSS例析.docx_第2页
第2页 / 共11页
关联分析--SPSS例析.docx_第3页
第3页 / 共11页
关联分析--SPSS例析.docx_第4页
第4页 / 共11页
关联分析--SPSS例析.docx_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《关联分析--SPSS例析.docx》由会员分享,可在线阅读,更多相关《关联分析--SPSS例析.docx(11页珍藏版)》请在三一文库上搜索。

1、关联分析(笔记)事物之间的关联关系包括:简单关联关系、序列关联关系。关联关系简单关联关系序列关联关系简单关联规则 :属于无指导学习方法,不直接用于分类预测,只揭示事物内部的结构。Spss modeler 提供了 APriori、GRI、Carma 等经典算法。 APriori 和 Carma 属于同类算法。卜PR数据可以是按事务表存储,亦可事实表存储。算法为提高关联规则的产生效率而设计不但可以处理分类变量,前项也可是数值变量数据只能按照事实表存储采用深度优先搜索策略实现算法序列关联:关联具有前后顺序,通常与时间有关。SPSS Modeler 提供了 sequence 算法;数据格式如下:按照事

2、务表存储,同事需要时间变量。ID | CONTENT | TIME 1001 香肠1T I 4 5 6 7 a 911001花生果1001饮料2OM喟酒3002饮料1002啤酒2002舌膈3003面包1003饮料2003舌肠3003噂酒34 4 4 5 5 5 0 0 0 0-00 o o o o o O04 O料酒肠酒饮喟香喟GustomerGuidJJRL Cate gorySequencelD |1 n0.000Loan2.00Q120.000Kits3.0003o.cooInsurance1 00041.00QNews Nortti America1000 J5-11.000Footb

3、all2.00Q51.000Foot&all3.00071.C00Baseball4 000131.00QBasketball5.000jg2.000Weather1.000102.C00A/eather2.00011_2.000leather3 000 口122.000Weather4.000132.000Weather5.000142.000Weather6.00Q71153000Shopping Computer1000 n163.000News Europez 口口口 n173.000News Asia3.000104.000Kews North Arnenca1 000194000V

4、Veather2.000 J205.000Flight1.00Q1412简单关联规则要分析的对象是事务生事务的储存方式有事务表和事实表两种方式。事务表顾客ID项集1A1D2B2D3A3C事实表顾客ID项目A项目B项目C项目D110012010131010两种表均表明,顾客 1购买了 AD两种物品,顾客 2购买了 BD两种物品,顾客三购买了 AC两种物品。关联规则有效性的测度指标1、支持度support:所有购买记录中,A、B同时被购买的比例。2、置信度confidence:在购买 A的事务中,购买 B的比例。 关联规则实用性的测度指标1、提升度lift:(在购买A的事务中,购买B的比例)/(所

5、有事务中,购买 B的比例)2、置信差3、置信率、正态卡方、信息差等等简单关联关系实例例1数据格式:事实表 算法:Aprioricardidvaluep methodsexhorn sownin to meagetuiteg|fresrneat dairy canneave5 canneameat13980942.712CHEQUEMNO2700046FTTFF26735225.357CASHFMO3030028FTFFF310B7220,618CASHMNO13200S6FFFTF42674323.Q8&CARDFNO1220026FFrFF5丁 60913,313CARDMYES119002

6、4FFFFF&26630JS487CARDFNO1530035FT-FF76299514,047CASHFY=S2080030TFFFF83876522 203CASHMYES2440022FFFFF所有购买项目均选入前项 antecedent和后项consequent。通I1字段模式:。简单的专家评佶测星,画圄萱度三j国怙尺度下限:|10;LI尢在段宿前项的规则输出结果的最低支持度是 10%;本例设定的划分频繁项集的标准大于最小支持度10%。最小置信度是80%;2。前项最多项目数:5本例中,三项以上没有超过10%的支持度,所以不能形成三项以上的频繁项集,最大的频繁项集大小是r后项实例支持度%

7、置信度荷规划支持%提升都箸能力froze nrnealbeeranno由碗16716767,42614t252.1cannedvegberfroze nneal117017.C85 8&214而2.S342.4ft-ozenTieal canneIveg31731734.33314.62眈71结论解释:实例:包含前项 beer、cannedveg的样本有167个,在1000个样本中 前项支持度 为16.7%。规则支持度:同时购买 beer、cannedveg、frozenmeal三项的支持度为 14.6%。规则置信度:购买beer、cannedveg的客户中,87.425%的人有购买froze

8、nmeal。规则2下,购买frozenmeal的可能性比购买 frozenmeal的支持度提高 2.895倍。数据格式:事实表算法:Apriori本例前项选择 性别和家乡,旨在不同性别和地区客户的购买行为是否存在频繁项集。由于AGE是数据类型变量,所以前项不能选入AGE,可在GRI算法中选入AGEurdidvaluepmstnodsexIomeoMiincomeagetuiteg|fresriTieat|dairycannelvegcannedineat1做0242.712CHEQUEUIVO2700046FTTFF2673&225.357CASHFNO3M0028FTFFF310S7220,

9、613CASHMNOWOO26FFFTF42674323.683CARDFNO1220025FFrFF59160918,813CARDM沱S1130024FFFFF62663045 487CARDFNO1530035FT-FF76299514,047CASHFY=S2030030TFFFF83876522.203CASHMYES2440022FFFFF一BASKETS, bd /11 字段 /I 11字段i后项前项Ml ID实例口支持置信管恪现fli陵等提升部罟能力froze nn&alsex24,842,82820.91.41327.9canrfrdvpgsex3dP9如77Q1&c1 3A

10、Spa qb&rsex146S48.840,164i9.e1.371292Sex=M序列关联规则实例事务表时间变重:time 算法:sequenceEUTICONTENT112 3 12肠生料酒料酒肠包百花饮噫饮呷香面JI JI 1 2_D o Qo O料胫酒生伏否吗在.-14.O3 4 12 2酒肠酒肠生包噂香啤香花面也面445555 6 b 000000,00 o o o o o o o O5_ I6|780 I1011.1213|14- |151S|17II192021 后项案例支持度力置信度规则支持先饮料啤酒466,667100.0S6.667饮料香肠36566775.050 CJ啤酒

11、香跖383 33360.050 0规则支持度 规则支持度 规则支持度饮料=啤酒 饮料=香肠 啤酒=香肠66.7%,规则置信度100%。50%,规则置信度75%。50%,规则置信度60%。将最下置信度调整为 30%,结果为:lL前项后项实例支持度纳置信度%规则支持饮料啤酒466.6671DC,066,667M香肠366.66775950.0唱酒香跖38333360.050.0花生米饮料266.66750.D33 332花生米面包266.66750.033,333在生米啤酒265.66750.D33 333饮料晦懑香肠266,66750.D33 333本例是客访问网页的数据,包括浏览的内容和顺序等

12、信息。模型旨在发现各类网页的浏览是否存在某种序 列关系。Customerguide:客户IDURKcategory:网页浏览内容sequencelD:浏览顺序,即时间顺序。I_Custom erCuiflURLCategcrySequentSlDAgeGenderMarrtajStatus10.000Loan2 00010-15MS20.000Kit&3.00010-15MSJ0.000Insurance100010-15s41.000News Norm America1.00010-15Fs_51.000Foatt)all2 00010-15Fs61 oaoFoolball3.00010-1

13、5FSI71.000Baseball4.00010-1&FsS1.000Basketball5.00010-1&FsgzoaoV/eather1.00020-35.FMI迪2.000Weather2.00020-35FM_J口二|翻customers字段神言簿宇段槿型号寡注解程型名称:。自动)自定义10.便用分0甥后最小规则支持度冬),10.0沅整规则)最小期则置信度(湖:50.0 &要添加到流的顼测:3-最大序列式小:10前项后项曲罟隹唐朋期,则=特AFliatitHot&l10311.986.55513.3Morth AmericaItlews -loiltiAtrerica12020 558,537120Ne值s North AmericaIweattier11520556.09811.5Flight=hotel,表示浏览航班网页的网民,随后86.6%的将浏览宾馆住宿的网页,规则支持度 为10.3%,规则置信度86.6%。 实例和支持度 都是前项的数据。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1