大型超市购物篮分析.doc

上传人:韩长文 文档编号:6279132 上传时间:2020-10-11 格式:DOC 页数:41 大小:466KB
返回 下载 相关 举报
大型超市购物篮分析.doc_第1页
第1页 / 共41页
大型超市购物篮分析.doc_第2页
第2页 / 共41页
大型超市购物篮分析.doc_第3页
第3页 / 共41页
大型超市购物篮分析.doc_第4页
第4页 / 共41页
大型超市购物篮分析.doc_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《大型超市购物篮分析.doc》由会员分享,可在线阅读,更多相关《大型超市购物篮分析.doc(41页珍藏版)》请在三一文库上搜索。

1、.题目 大型超市“购物篮”问题分析 摘要本文对于大超市商品的关联度以及商品最频繁同时购买问题进行分析,构建合理的数学模型,并给出可操作的商品销售方案。问题一要求统计处理4717个顾客对999中商品的购买记录数据,建立数学模型,定量表达超市中多种商品间的关联关系的密切程度。首先建立遗传算法,利用统计得出各个商品购买数量,并计算出标准差。再对影响关联度的另一度量指标进行分析,将数据分类利用处理数据,得出商品间的欧氏距离。最后加上实际影响因素,建立模型:利用进行统计与描述,可以得出共有623种商品关联度为0.1888,299种商品间关联度为0.0705,88种商品间关联度为0.0245,33种商品间

2、的关联度为0.0074,11种商品间的关联度为0.0022,5种商品间的关联度为0.0020。问题二要求分析说明哪些商品是最频繁被同时购买的,并在问题一的基础上,用一种快速有效的方法计算。已知问题1的结果,将商品进行分类,运用贪婪算法逐步得出被同时购买的商品数,利用得出结果。综合以上分析可以得出,五种商品的购买组合中商品413,商品424,商品538,商品572,商品797,购买次数最高,102次,组合利润最高1485.399,总利润最高151510.698。因此,将这组商品作为最优组合。问题三要求根据问题1、问题2中建立的模型,对附件2中999种商品的利润进行分析,给出一种初步的促销方案。对

3、数据运用进行拟合,得出商品利润与商品之间的关联度符合线性关系。对附件2中利润数据分类,分别计算结果。最后,给出促销方案。精品.关键词 遗传算法 欧氏距离 关联度 贪婪算法1、 问题背景和重述1.1问题背景超市购物属于日常生活,而每天来超市购物的顾客和购买的商品都具有不稳定性。商品的销量会因顾客的喜好或时间的影响不断变化,又因商品购买存在随机性、多元性等特点,必须估测好每种商品的需求量。如处理不当,很可能造成仓库囤积量增多,甚至造成超市利润损失过大。 商品购买是不确定的,但某种或某些商品会获得大多数人的认可,被顾客频繁购买。在大型超市中,商品繁多、复杂,正确分析并估算顾客对某种或某些商品的喜好,

4、将为超市经理合理设计进货方案、处理仓库、获得最大利润、搞推销、促销活动和购物赠送活动等提供理论依据。商品市场分析和顾客购物习惯分析,作为超市一项基础性任务,不仅可以确定超市进货合理模式及合理促销方式,还可以为各大型超市确定今后整体规划、超市规模、商品购买后评估等提供更为科学的理论依据。1.2问题重述现给出超市进一个星期的所有顾客购买物品的清单和相应商品的价格,分析所给数据,研究以下问题,并建立合理的数学模型:1、 附件 1 中的表格数据显示了该超市在一个星期内的 4717 个顾客对 999 种商品的购买记录,表格中每一行代表一个顾客的购买记录,数字代表了其购买商品的超市内部编号。根据附件1(详

5、见附录1),建立一种数学模型,定量表达超市中多种商品间的关联关系的密切程度。精品.2、 根据问题1中建立的模型,寻找一种快速有效的方法从附件1的购买记录中分析出哪些商品是最频繁被同时购买的。3、综合上述分析和求解,分析附件2(详见附录1)给出的999中商品利润,并根据问题1、问题2中建立的模型,给超市经理一个合理的“购物篮”分析报告,提供一个促销计划的初步方案。2、 问题分析2.1问题一的分析要定量表达超市中多种商品间的关联关系的密切程度,首先要根据附件1表格中的数据统计出各种商品被购买的数量,可以建立基于神经网络算法的遗传算法模型。遗传算法是一种适合于复杂系统优化计算的自适应概率优化技术,能

6、够较好地计算复杂数据和概率。超市商品种类繁多,表格中给出的数据量多,要将这些数据进行分类,计算出标准差和欧氏距离。标准差是数据偏离平均数的距离平方的平均数,能反应一个数据集的离散程度。欧氏距离是指m维空间中两个点之间的真实距离,或向量的自然长度。本题中属于二维空间,因此表示的是数据的真实值。在平均数相同时,标准差不能反映出各个数据之间的差别,欧氏距离可以。最终,可以综合利用标准差和欧氏距离,更好地反映商品间的关联度。2.2问题二的分析要分析说明999中商品中哪些商品是被最频繁同时购买的,并找出尽可能多的商品被频繁同时购买,就要先根据问题一所给附件1中的购买记录和问题一的模型,得出多种商品之间的

7、关联度。在遗传算法的基础上,运用贪婪算法对所得数据结果进行分类计算。贪婪算法(Greedy algorithm)是一种对某些求最优解问题的更简单、更迅速的设计技术。用贪婪设计算法的特点是一步一步地进行,常以当前为基础根据某个优化测度作最优选择,而不考虑各种可能的整体情况。它采用自顶向下、以迭代的方法做出相继的贪心选择,每做一次贪心选择就将所求问题简化为一个规模更小的子问题,可得到问题的一个最优解。精品.问题二已知多种商品间关联度的数据结果,因此运用贪婪算法可将本问逐步简化为规模更小的问题。2.3问题三的分析要给出一种初步的促销方案,使超市的效益进一步增大,就要先计算出999中商品各自给超市带来

8、的利润,并综合商品的自身特质和顾客的喜好。要求根据问题一、问题二建立的模型,求解问题三。问题三属于方案题,不仅要计算统计客观数据,而且要综合多种因素考虑,并结合实际情况给出合理切实际的方案。运用计算出各种商品组合的利润,包括单个利润、组合利润和总利润。按照最优原则,选择符合条件的最优商品,结合问题一、问题二中的商品关联度和商品频繁购买数,选出综合最优商品。对市场做多次调查,了解顾客喜好。通过打折促销、赠送促销和人员推销等方法,增加商品购买力,获得更高利润。3、 符号说明由于本文在解答过程中出现很多符号,现将这些符号进行解释:符号解释说明第n个商品的编号第n个商品被购买的次数所有事物的集合置信度

9、最大置信度平均置信度所有事物的集合子项目的集合关联度打折数最大利润四、模型假设为使得题目解决方便,现对一些客观存在但影响可忽略不计的因素进行假设:1、假设各个商品的利润保持不变;精品.2、假设顾客收入基本稳定,经济发展较为平衡,即短时间内不会出现经济危机问题;3、假设表格中的数据能真实地反映当地消费者的购物情况;4、假设短时间内商品的销售情况维持稳定,不会出现大幅波动。5、 模型建立与求解5.1数据预处理及模型准备5.1.1数据预处理对于附件和附件所给出的表格数据,发现存在少量数据的缺失。由于表格中所给数据量大,相比较于999种商品和4717位顾客购买商品数量,缺失的数据相对可忽略不计。由于附

10、件1所给表格不能够直观地进行统计,就运用软件将大量数据进行分析处理,再将文本数据转化至表格。通过统计出各个商品被购买的次数,为保证结果的精确性,多次试算统计出每种商品被顾客购买的次数,绘制出表格3(全部数量见附件1)。5.1.2模型准备设 是所有项目的集合。是所有事务的集合(即数据库),每个事务是一些项目的集合, 包含在中,每个事务可以用唯一的标识符来标识。设I为某些项目的集合,如果I包含在中,则称事务包含A,就相当于两个不同的的相同序列 ,这里包含在中,包含在中,并且IH=。其意义在于一个事务中某些项的出现,可推导出另一些项在同一事务中也出现为简单化,将(包含在)=(H包含在)表示为,这里“

11、”称为关联操作。 5.2问题一模型的建立与求解大型超市商品种类繁多复杂,经营内容趋向大众化和综合化。同时,超市自动标价、计价,节省了顾客的时间,也满足了顾客一次性购足的方式,深受顾客的喜欢。超市经营方式要灵活,必须了解顾客对各种商品的购买情况,才能形成低成本、大流量的经营模式。根据表1数据,采用商品的置信度表征商品之间关系。因此,如果用次表示商品n被购买的次数,所有商品的集合为,n种商品被购买次数之和为,则各个商品的置信度为:精品.运用软件处理数据,并计算出各个商品被购买的次数,此处列出50中商品购买的次数(全部结果见附录1表1),绘制表格如下:表1 前50种商品购买的次数商品编号123456

12、78910购买次数3092691972651561527667340181商品编号11121314151617181920购买次数186255341227330112010210商品编号21222324252627282930购买次数49417964236427238372280220商品编号31323334353637383940购买次数398524220833221116737635370这里的置信度相当于遗传学中的的序列,通过取出具有代表性的置信度或序列,作为衡量商品间关联度的一个指标。再建立基于神经网络算法的遗传算法1模型,为了进一步精确地得出商品间的关联关系,采用遗传算法中的选择算法

13、,并确定一个标准筛选出关联度较大的商品。将最小置信度设定为千分之四,从4717个原始数据项中得到个数为17的频繁项集。按置信度降序排列,绘制如下表2:表2 17种商品的置信度编号3688295295100.000515419217489438置信度0.00710.00590.00580.00500.00500.00470.0045编号956766914682692937205720722置信度0.00450.00440.00440.00430.00430.00480.00410.00400.0040由表2可以看出,商品368号为最大置信度,商品722号为最小置信度,最大置信度与最小置信度之间相

14、差较大。根据表2中的最小置信度与最大置信度将置信度均分为八份,运用软件求出各个区间内的商品个数,整理得到表3:表3 各置信区间的商品个数置信区间商品个数6232998833置信区间商品个数11501精品.将上述区间分为8个区间,再利用绘制散点图如下:图1 各个区间内的商品分析散点图可知,在第1到第4区间商品数较多,第5到第8区间商品数较少。即大多数商品关联度不高,只有少数商品关联度较高。通过软件均分置信度,求出各个区间内的欧氏距离与方差,比较欧氏距离与方差,得出商品间的关联关系的密切程度。再根据表2的区间,运用 软件求解出欧氏距离与方差,绘制如下表4:表4 各个区间内的商品置信区间欧氏距离0.

15、18880.07050.02450.0074标准差0.003030.002940.002750.00204置信区间欧氏距离0.00220.002000标准差0.001770.0003900利用绘制散点图如下:精品.图2 欧式距离和标准差通过综合比较多种商品间的标准差和欧氏距离,可以得出共有623种商品关联度为0.1888,299种商品间关联度为0.0705,88种商品间关联度为0.0245,33种商品间的关联度为0.0074,11种商品间的关联度为0.0022,5种商品间的关联度为0.0020。5.3问题二模型的建立与求解问题二要求根据问题一中建立的模型,分析出哪些商品是最频繁被同时购买的,求

16、解出被同时购买的数量越多越好。根据置信度的定义可推出,某商品组合的置信度越高,表示该组合越频繁被同时购买。分析所给表1中的数据,将所筛选出的商品种类选出,运用贪婪算法找出最频繁购买的商品组合。与问题一中两种商品的组合进行匹配,去掉重复项,得到两种商品组合,挑选出满足置信度的组合。同样进行满足置信度的三种商品、四种商品、五种商品的选择依次循环直到没有符合最低置信度的组合程序结束。首先,要计算两种商品组合,依据置信度挑选出符合条件的商品。截取前五位绘制如下表5:表5 两种商品组合的排名次数排名AB购买次数1368529334精品.2368829313336821729143684892915368

17、682289由表5可以看出,两种商品组合的购买纪录中,368号商品与529号商品的购买组合为最频繁购买组合,商品数为2,频繁出现334次。和表5所用方法一样再计算三种商品组合,依据置信度挑选出符合条件得商品。再截取前5位绘制表格如下:表6 三种商品组合的排名次数排名ABC购买次数1368489682124295653841312234245727971164538413797115595653879711469564137971147413572956114由表6可以看出,三种商品的购买组合中编号为368、489和682商品的购买组合为最频繁购买组合,商品数为3,频繁出现124次。通过表5和表

18、6可以看出编号为368号的商品,被购买最为频繁。由于本题要求找出被频繁同时购买的商品数越多越好,因此最频繁购买的单一商品不合要求你,要对数据做更多种组合的处理。精品.依照前两项采用的方法贪婪算法,计算四种商品组合,依据置信度对被频繁购买的商品次数进行排名。由于数据量大,只能选取排名靠前的商品绘制表格。此处选取排名前7位绘制表格如下:表7 前四种商品组合的排名次数排名ABCD购买次数141342457295610724135727979561073424572797956107441342479795610654135387978261066413538797956106741379782695

19、6106由表7可以看出,四种商品的购买组合中编号为413、424、572、956和413、572、797、956和424、572、797、956商品的购买组合为最频繁购买组合,商品数为4,频繁出现107次。再将表7与表5、表6得出结果进行比较,可知368号单个商品购买最为频繁,其他商品次之。运用贪婪算法进行最后一次运算,得出五种商品组合的排名,并选取靠前商品进行排名绘制表格8:精品.表8 五种商品组合的排名次数排名ABCDE购买次数1413424538572797102由表8可以看出,五种商品的购买组合中编号为413、424、538、572、797号商品的购买组合为最频繁购买组合,商品数为5,

20、频繁出现102次。综上表格可得,最频繁被同时购买的商品是编号为413、424、538、572、7975.4问题三模型的建立与求解5.4.1求解商品组合的利润问题三要求根据问题一、问题二中建立的模型,计算999种商品对应的利润,给出一种初步的促销方案,使超市的效益进一步增大。分析表2(见附录1表2)的数据,结合问题二中求解最频繁购买商品的方法,分类处理表中给出的利润,并进行比较得出结果,截取前5位绘制表格。按照商品组合分类,求解各个分类的商品利润。运用将数据进行分析统计,结果绘制如下表:表9 两种商品组合的利润AB次数单利润总利润368529 334575.95304677.5536882931

21、3479.64397621.56368217 291296.118864257.7796368489 291296.1188144802.0932368682289315.259215006.638由表9可以看出,两种商品的购买组合中商品368,商品829的购买组合利润最高。尽管此商品组合购买次数并非最多,但考虑到超市利润最大化的经营目标,将此组合作为最优商品组合。精品.根据分类对三种商品组合所得利润进行计算,通过计算得出的结果,绘制表格如下:表10 三种商品组合的利润ABC次数单利润总利润368 489 682 124320.467839738.0072956 538 413 122477.

22、28958229.258424572797116664.0577029.8538 413 797115401.80946208.035956538797114477.28954410.946956413797114641.6773150.38413572956114717.1581755.1由表9可以看出,三种商品的购买组合中商品413,商品572,商品956的购买组合利润为717.15,总利润为81755.1。单利润和总利润都为此类商品组合最高,因此将此组合作为最优商品组合。对四种商品组合的利润求解,按购买次数进行升序排列,将得出最优结果绘制如下表:表11 四种商品组合的利润ABCD购买次数

23、单利润总利润413424572956107928.2699323.82413572797956107905.8896929.16424572797956107928.2699323.82精品.413424797956106852.7890394.68413538797826106426.15845172.748413538797956106666.01970598.014413797826956106666.01970598.014由表10可以看出,四种商品的购买组合中商品413,商品424,商品572,商品956和商品413,商品572,商品797,商品956的购买次数为107次,组合利润最

24、高为928.26,总利润为99323.82。综合考虑各种因素将此组合作为最优商品组合。 分析五种商品组合的购买次数、组合利润和总利润,将符合条件结果绘制成表格,如下:表12 五种商品组合的利润ABCDE购买次数单利润总利润4134245385727971021485.399151510.698由表11可以看出,五种商品的购买组合中商品413,商品424,商品538,商品572,商品797,购买次数最高,102次,组合利润最高1485.399,总利润最高151510.698。因此,将这组商品作为最优组合。综合分析以上购买组合利润可知,368和829号商品出现在两种最优销售组合中,同时829和36

25、8号商品组合也位于频繁购买的前五位。已知各商品的关联度,结合分析购买组合利润可知,829号商品与368号等其他商品关联度较高,829号商品销售量增加可带动其他商品销售量大幅上升。因此,商家可对利润较低的829商品采取相应的促销措施,利用829商品销量上升,带动368等高利润商品销量上升,进而促进销售额与总利润的增长。5.4.2打折促销方案精品.5.4.2.1打折促销2根据问题三模型的建立与求解所得结果可知,不同商品组合可获得不同利润,频繁购买次数不同。因此,选择获得利润高同时被频繁购买的商品组合,对这些商品进行推销处理。首先,各大超市都会将快要过期或进货早的商品放在商品担架的最外部。由于本题讨

26、论的是被频繁购买的商品,不考虑过期等外部影响因素,因此,可将高利润商品集中放在超市内最受欢迎处或放在同类商品货架最外边,达到利润最大化的目的。单个最频繁购买商品和多个最频繁同时购买商品不同。对单个商品采取薄利多销策略直接打折促销,吸引顾客购买,获得利润增加。对于多种商品组合,选取组合中和其它高利润商品关联度较大而利润较低的商品,通过对这类商品打折,其它高利润商品价格不变,就可以在大量购买打折商品的同时,引起高利润商品的多次购买。此时,损失最小利润获得更高利润。若一个商品组合中有一个关联度较高而利润较小,可以对此商品进行打折,其他商品价格保持不变。假设经过多次市场实践调查,得出当打折为时获得的最

27、大利润为,那么即为确定的折扣。例如组合(X,Y),对利润较低的X商品打折,保持Y商品价格不变。结合上述结果综合分析得,商品编号为368、829、529对其它商品关联度最高分别为0.0071、0.0059、0.0058,而编号829商品单个利润相对较低为188.73。因此,将编号368、829、529商品打折,其它高利润商品价格保持不变。5.4.2.2赠送促销为降低部分顾客只购买打折商品的发生几率,超市可以先统计出该购物群体绝大多数的消费水平,将其上调部分后,配合同时期的打折活动推出购满上调后金额赠送小礼品的活动。例如该购物群体每次消费在80100元之间占绝大多数,基于此信息采取购满99元返券、

28、满99元加1元赠送抽纸一包的促销措施来提高销售量;基于大多数人贪小便宜的消费心理,很多消费者会选择购满99元。这些措施不仅使得顾客的交叉消费大为提高,还能提升顾客对超市的满意度,增加再次光临选购的几率。精品.7、 模型评价和改进7.1模型的评价遗传算法具有良好的全局搜索能力,并且利用它的内在并行性,可以方便地进行分布式计算,加快求解速度。但是遗传算法的局部搜索能力较差,在进化后期搜索效率较低。在实际应用中,在同时保持个体的优良性与多样性是个较难解决的问题。贪婪算法是在某种意义上的局部最优解,效率高。但随着问题规模和复杂度的不断提升,单一的算法在其收敛性和求解速度等方面已经表现出局限性,因此很少

29、用于实例当中。7.1.1模型的优点1、遗传算法对解题技巧和问题的深入理解要求不高,应用范围非常广泛,且易于理解和推广;2、在处理表格中的数据、计算度量指标时,运用求得结果,操作简便,容易实现;3、遗传算法具有并行计算的特点,通过大规模并行计算可以大大提高计算速度,计算简单;4、遗传算法同求解问题的其他启发式算法有较好的兼容性,对于各种特殊问题可以提供极大的灵活性来混合构造领域独立的启发式,从而保证算法的有效性。7.1.2模型的缺点1、 某个局部最优个体不易被淘汰反而快速扩散,使得全局搜索能力不强,无法逼近全局最优解;2、 容易出现早熟收敛和随机漫游现象,机构计算的工作量过大而导致搜索速度较慢等

30、。3、遗传算法对算法的精度、可信度以及计算复杂性等方面,还没有有效的定量分析方法。7.1.2模型的改进精品.在模型的分析与建立过程中,忽略了一些因素,在模型改进的时候,可以将上述过程中忽略的因素加以考虑。同时,题目所给的视频时间较短,同时视频中间还存在中断,造成了数据的缺失,使得模型的准确度不是特别高,在改进的时候,可以获得更多更全面的数据,这样可以使得模型更加具有说服力。8、 模型推广尽管遗传算法本身在理论和应用方法上仍有许多待进一步研究的问题,但它的应用非常广泛,尤其适合于处理传统搜索方法难以解决的高度复杂的非线性问题。它在函数优化、组合优化问题求解、生产跳读问题、自动控制、模式识别、信息

31、处理、规划设计、机器学习、图像处理、机器人学、人工生命、遗传编程等领域的应用中已展现出其优越性和魅力,从而也确定了它在21世纪的智能计算机技术的关键地位。遗传算法有自己独特的优点,同时也存在缺点,可以将遗传算法与其它算法相结合来求解一般问题的想法,并将遗传算法的应用范围扩展,提出可以运用遗传算法求解由精品.衍生出的各类扩展问题,如求解配送、手机旅行商问题的遗传算法()、遗传算法在货物配送问题中的应用()、多旅行商问题()。假设有件任务,标号为到。若将任务分给机器,任务分给机器,任务分给机器,这种分配是可行的分配,共使用了七台机器。但它不是最优分配,因为有其他分配方案可使利用的机器数目更少,例如

32、:可以将任务分配给同一台机器,则机器的数目降为五台。一种获得最优分配的贪婪方法是逐步分配任务。每步分配一件任务,且按任务开始时间的非递减次序进行分配。若已经至少有一件任务分配给某台机器,则称这台机器是旧的;若机器非旧,则它是新的。在选择机器时,采用以下贪婪准则:根据欲分配任务的开始时间,若此时有旧的机器可用,则将任务分给旧的机器。否则,将任务分配给一台新的机器。根据例子中的数据,贪婪算法共分为步,任务分配的顺序为。贪婪算法4(又称贪心算法)是指,在对问题求解时,总是做出在当前看来是最好选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到

33、整体最优解,但对范围相当广泛的许多问题他能产生整体最优解或者是整体最优解的近似解。精品.9、 参考文献1吴耿锋,上海大学计算机学院,遗传算法及进化神经网络,20049(3)。2圣感,超市促销活动方案,http:/ 172ded63b798.html,2014.7.26。420055248,贪婪算法,http:/ 1d.html,2014.7.26。精品.附录附录一表1 商品购买次数序号123456789次数3092691972651561527667340序号101112131415161718次数1811862553412273301120序号192021222324252627次数1021

34、049417964236427238372表2 两个商品的组合商品A368368217368368368368368368商品B529829368489682419937692510次数334313291291289269262261260商品A368529529368438217692419205商品B914692829720529529829829368次数259257255249244242237237230附录二通过建立模型,求解第一题矩阵分布程序如下:a=xlsread(C:/UsersAdministratorDesktop表格商品购买次数.xls);b=0;for i=1:100

35、0 b=a(i,2)+b;end精品.c0=0;c1=0;c2=0;c3=0;c4=0;c5=0;c6=0;c7=0;for i=1:1000; if a(i,2)/b0.007 c0=c0+1; d0=a(i,1); if a(i,2)/b0.006 c1=c1+1; d1=a(i,1); elseif a(i,2)/b0.005; c2=c2+1; d2=a(i,1); elseif a(i,2)/b0.004; c3=c3+1; d3=a(i,1); elseif a(i,2)/b0.003;精品. c4=c4+1; d4=a(i,1); elseif a(i,2)/b0.002; c5

36、=c5+1; d5=a(i,1); elseif a(i,2)/b0.001; c6=c6+1; d6=a(i,1); elseif a(i,2)/b0; c7=c7+1; d7=a(i,1); endenddo=sqrt(1/2*d) 利用解欧氏距离程序如下: a=xlsread(C:/UsersAdministratorDesktop表格1.xls);d=0;for i=1:239 for j=1:239 b=(a(i,2)-a(j,2).2; d=d+b end精品.end利用求取商品组合:data1=xlsread(C:UsersAdministratorDesktop表格数据表);%

37、求取0-1矩阵data=zeros(4718,999);for i=1:4718 for j=1:72 if data1(i,j)0 data(i,data1(i,j)=1; end endend%不同种类产品的购买次数B1=zeros(999,2);for i=1:999 B1(i,1)=i;endfor i=1:4718 for j=1:999 if data(i,j)=1 B1(j,2)=B1(j,2)+1; end精品. endend%排除不在置信区间内的数字 t=1; Value_supt=100;%两商品支持度阙值 for i=1:999 if B1(i,2)Value_supt

38、C1(t,:)=B1(i,:); t=t+1; end end%满足置信度的单价商品所构成的两件商品组合 n=size(C1,1);%n为C1的行数 n2=0; t=1; n3=n*(n-1)/2; B2=zeros(n3,3); for j1=1:n-1 for j2=j1+1:n for i=1:4718 if data(i,C1(j1,1)=1&data(i,C1(j2,1)=1 n2=n2+1;精品. end end B2(t,1)=C1(j1,1); B2(t,2)=C1(j2,1); B2(t,3)=n2; n2=0; t=t+1; end end %满足置信区间的两件商品的组合

39、a=find(B2(:,3)Value_supt); n4=size(a,1); C2=zeros(n4,3);t=1;for i=1:n3 if B2(i,3)Value_supt C2(t,1)=B2(i,1); C2(t,2)=B2(i,2); C2(t,3)=B2(i,3); t=t+1; endendn2=0;t=1;精品.n3=n1*n;B3=zeros(n3,4); for j1=1:n1 for j2=1:n for i=1:4718 if data(i,C2(j1,1)=1&data(i,C2(j1,2)=1&data(i,b(j2)=1&b(j2)=C2(j1,1)&b(j

40、2)=C2(j1,2) n2=n2+1; B3(t,1)=C2(j1,1); B3(t,2)=C2(j1,2); B3(t,3)=b(j2); end end B3(t,4)=n2; n2=0;t=t+1; endend %满足置信度的3件商品a=find(B3(:,4)Value_supt);n4=size(a,1);C3=zeros(n4,4);精品.t=1;for i=1:n3 if B3(i,4)Value_supt C3(t,1)=B3(i,1); C3(t,2)=B3(i,2); C3(t,3)=B3(i,3); C3(t,4)=B3(i,4); t=t+1; endend%满足置信度的3件商品组合成的4件商品b4=unique(C3(:,1,2,3);n=size(b4,1);n1=size(C3,1);n2=0;t=1;n3=n1*n;B4=zeros(n3,5); fo

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1