出租车数量估计赵朋飞修改版B题.docx

上传人:scccc 文档编号:12588545 上传时间:2021-12-04 格式:DOCX 页数:14 大小:102.79KB
返回 下载 相关 举报
出租车数量估计赵朋飞修改版B题.docx_第1页
第1页 / 共14页
出租车数量估计赵朋飞修改版B题.docx_第2页
第2页 / 共14页
出租车数量估计赵朋飞修改版B题.docx_第3页
第3页 / 共14页
出租车数量估计赵朋飞修改版B题.docx_第4页
第4页 / 共14页
出租车数量估计赵朋飞修改版B题.docx_第5页
第5页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《出租车数量估计赵朋飞修改版B题.docx》由会员分享,可在线阅读,更多相关《出租车数量估计赵朋飞修改版B题.docx(14页珍藏版)》请在三一文库上搜索。

1、宝鸡文理学院2014年数学建模培训第二次模拟姓名系别学号赵朋飞数学系201290014087土义鹏计科系201296014053叶鹏物理系201291024078由租车数量的估计问题摘要本文运用概率统计的思想,解决了出租车数量的估计问题。依据题目要求,我们建 立了两种估计模型,估算出了该小镇出租车的数量,并且对模型的可靠性进行了检验。对于模型一:首先,题目所给样本数据是随机的,通过 MATLAB软件作图,发现区 问间隔为100时,落在每个区间车牌号数量是均匀分布的,即车牌号服从于均匀分布。 而车牌号又是按顺序排列的,所以样本中的最小车牌号与最大车牌号趋近于该市机动车 出租车车牌号的起始号与终止

2、号,试假设该机动车 出租车车牌号区间为24000,31999 , 进而求出该市机动车 出租车的总数量为N 8000辆;然后,对于样本中所给的出租车牌 号,经过后减运算,得到每两个相邻的车牌号之间间隔的车牌号数量,用EXCELS件排序并作图,剔除了极端差值,其余求其平均数,即每辆出租车车牌号之间间隔平均是x 55;最后计算出该小镇出租车的数量 n 146辆。对于模型二:由于模型一中确定该市机动车 出租车车牌号区间不甚精确,我们考虑 对其进行优化。首先,我们运用了两种方法估计了该市机动车的总数量:方法一,引用 盟军估计德军坦克数量的模型估计出该市机动车的总数为8046;方法二,运用极大似然估计函数

3、确定该市机动车 出租车的车牌号区间为24176,31982,经端点值作差得出该市 机动车出租车的总数为7806 ;(这两种方法貌似得去掉一个)将小种方法(去掉)所求 的该市机动车总数均值作为该市机动车最终数量N' 7928。然后,把样本的车牌号每隔1000进行统计,得到每1000个车牌号中的出租车车牌数量,对得到的数据用SPSSa件进 行检验,显示呈正态分布并得其均值 y 17 ,采用极大似然估计法求得正态分布总体 N( , 2)中参数? y 17 ,即该市每1000辆机动车出租车中有17辆出租车属于 分配在 该小镇。最后计算出该小镇有出租车 n 153辆综合两种模型,模型一对机动车车

4、牌号范围的区间估计不够精确,而模型二在估算 机动车牌号范围的区间时,恰当运用盟军估计德军坦克数量模型与极大似然估计法,比 较精确地求得该市机动车的数量。另外,模型二对车牌号分区间考虑使得估算更为合理。 模型检验中偏态系数与峰度系数对统计数据的分析使得模型更为完善。(改为)最后我 们对两种模型的优缺点进行了讨论。关键字:极大似然估计 正态分布 SPSS软件偏态系数峰度系数一、问题重述小张寒假回到他的家乡某小镇,在出门探亲访友过程中,他发现小镇的出租车,存 在诸多问题。他打算从小镇的出租车数量入手,解决这些问题。在接下来的几天时间里, 他随机的记录了 133辆出租车车牌号的后5位见(附录1)。他只

5、知道车牌号是按顺序 排列的,但他不知道车牌的起始号,也不知道车牌的终止号,他希望通过上述数据估计 出小镇的出租车数量。要求帮助小张设计一种或多种数学模型,来估计小镇出租车的数量,并分析方法 的可靠性。二、模型假设1、样本统计过程中没有考虑外来车辆 2、该市机动车的车牌号连续。3、该市机动车与车牌号对应。4、该市机动车车牌号的后五位均由数字组成三、符号说明符号含义NX(i) i 1,2,133X (i) i 2,133XxnabkPq?Xi该市机动车数量原始车牌号序列样本相邻车牌号的差值序列差值的平均值俩车牌号的间隔小镇出租车数量样本均值样本方差方差样本中最小的车牌号样本中最大的车牌号样本中车牌

6、号的数量该市机动车下限的最大似然估计值该市机动车上限的最大似然估计值总体均值组中值Fi对应比重a3a4偏态系数 峰度系数四、问题分析本题属于概率统计问题。要估算出该小镇出租车的数量,首先需要估算出该市机动 车出租车的数量。考虑到题目所给样本数据是随机的, 通过MATLAB软件作图,发现区 问间隔为100时,落在每个区间车牌号数量是均匀分布的,即车牌号服从于均匀分布。我们可以采用点估计,即以实际样本指标数值作为总体参数的估计值,估算出该市机动 车的数量,进而估计出小镇出租车数量。我们可以从以下两种思路来求解:思路一:由于样本中的车牌号均匀分布,考虑到所在地为小镇且车牌号是按顺序排 列的,所给车牌

7、号码的最小值与最大值就非常趋近于起初号和终止号,所以假设车牌号 区间为24000, 31999。经过后减运算,剔除坏数据,得出每两辆车牌号之间相差的个 数,从而得出小镇出租车的数量。思路二:对思路一中确定总体车牌号区间存在的不精确性,我们将其进行优化,可 以用点估计川与极大似然函数(和摘要对应,去掉一种方法)确定总体的车牌号区间。 参照点估计中最小无偏估计,采用较为准确的计算公式确定车牌号区间,即为该市机动 车总数,当然,我们还可以利用极大似然函数确定车牌号区间。(与上对应,去掉一种方法)其次,将样本的车牌号每隔1000进行统计,得到的统计数据求其平均值,把所得 平均值与机动车总数的千分之一的

8、乘积作为该小镇出租车数量的估计值。五、模型建立与求解5.1模型一:对于随机分布的样本数据,若其服从于均匀分布,可取接近样本最大值与最小值的 数据作为总体区间的上下限,即区间 a,b ,进而可得总体的数量为N b a 1。据问题分析知样本中的车牌号均匀分布,且已设车牌号区间为24000,31999 ,故得总的车牌号数量,即该市机动车的数量N 8000。由题目已给条件知原始车牌号序列:xx,x?2),x(133)即:x(0) 24176, 24231, ,31982由后减运算计算,即求出后前两个数据之差:x(1) x(°)(i) x(0)(i 1),其中 i 2,- -,133;可得一个

9、新的序列:xx(2), x(3),x(133)利用EXCEL软件,以此新序列排序作为纵坐标并作图1:数据差值图图1观察图1,发现中间部分有很多均匀的差值,两端出现较大的波动,忽略两端极端 差值,即剔除40以下和90100以上的差值,其余求平均值,经 EXCELS件计算得平均 值约为X 55,即两车牌号之间间隔 x 55。由此估计出出租车数量为:x结合以上数据,估计出该小镇共有出租车146辆。5.2模型二:(去掉一种方法,建议去掉盟军模型)1 .估计样本对应总体的取值空间(该市机动车数量):方法一:在统计学理论的估计中,用不放回抽样来估计离散型均匀分布最大值问题 是著名的德国坦克问题1。针对该问

10、题,建立盟军估计德军坦克数量模型。对于点估计(实际样本指标数值作为总体参数的估计值),最小方差无偏估计由下 式给出并以此确定总体取值区间:a是样本最小值,b是样本最大值,k是样本大小题目中所给车牌号为随机抽取的一组数据,其为离散均匀分布 ,结合题目已知,样本中出租车车牌号的最小值a 24176,出租车车牌号的最大值 b=31982 ,出租车数量k 133,代入以上公式求得N 8046。即在车牌号连续的情况下,可估计该市机动车数量 N 8046。方法二:再者,我们可以以极大似然估计来确定总体取值区间:设总体C在p,q上服从于均匀分布,x1,x2,xn是一个样本值,我们来确p,q的最 大似然估计量

11、记 xmin(x1,x2,-xn),仁max(x1,x2,-xn), C 的概率密度是1,p x qf (x; p,q) q p0, else由于p Xi,X2,Xi33 q ,等价于px(1) , qX(n)。似然函数为L(p,q)1(q p)n1(Xn X1)n即L(p,q)在p x(i),q 9)时取到最大值(x(n)x°)故p,q的最大似然估计值为:?X(1)门”为,q?x(n)max1 i n即:? min Xi,? max Xi1 i n1 i n该市机动车出租车车牌号C在p,q上服从均匀分布,24176,24231,31982为样本 出租车车牌号,样本最小值x(i)24

12、176,样本最大值 而)31982 ,可求得p的最大似然 估计量为24176, q的最大似然估计量为 31982。即该市机动车 出租车车牌号区间为 24176,31982 ,在车牌号连续的情况下,可估计该市机动车数量 N 7806。综合考虑方法一与方法二所得该市机动车数量N ,我们将其平均值(N' 7928)作为估计该小镇出租车数量的基数。2 .将样本数据分成若干区间考虑(估计该小镇出租车数量):把样本的车牌号每隔1000进行统计,得到每1000个车牌号中的出租车车牌数量并作表1 :区间出租车车牌数量(个)2400024999162500025999182600026999192700

13、02799917280002899917290002999916300003099917310003199913表1 :出租车车牌数量统计表观察表1,对于指定区间的出租车车牌数量我们加以分析,通过SPSSa件2,使用K-S对其进行正态性检验(附录2),检验结果如图2:假设检验汇总一嘘R岁设熟试Sig. 决策省VARCOOQ2的分相为正态分布平Kdmtdorov. 均值为16通机杷架为17九赛需品屈示斯进量蓍性-显著性水平是05.图2:正态性检验根据检验结果,指定区间的出租车车牌数量符合正态分布。接下来求正态分布N( , 2)中,2的极大似然估计量2)参数的y1,y2,yn是正态分布总体N( ,

14、 2)的随机样本,需要求正态分布N(,极大似然估计量。似然函数为:L( , 2)-exp i 1 ,2(yi)2n2exp(yi1)2取对数,得:2lnL(,)n, ln(22n.In2(yi)2那么似然方程组为:解得:lnL(,JnL(2)2)(yiyi y(yi)2)2(yi)20因此,正态分布总体平均数的极大似然估计量为? 1 n i方差估计量为:)2(yi2对于出租车车牌数量统计数据,16,18,,13是正态分布总体N( , 2)的随机样本, 所以因为y 17,所以得出总体均值? y 17,即以上八个车牌号区间中出租车车牌 数量的平均值约为? 17,即可近似认为该市每1000辆机动车中

15、有17辆出租车属于分 布在该小镇,进而求出该小镇出租车的数量为:N' 9n ?1000综合以上,? 17, N' 7928代入上式,可估算出该小镇共有出租车153辆。六、模型检验为了推断模型二(2)中统计数据的未知特性,我们提出统计数据服从于正态分布的假 设,并采用极大似然估计法对其参数进行了估计。作出出租车车牌数量统计图如图 3。了解到集中趋势和离散程度是数据分布的两个 重要特征,要全面了解数据分布的特点,还需要知道数据偏斜的程度及分布的扁平程度 等,我们可以从偏态和峰度的角度对这些分布特征进一步描述。出租车车牌数量统计图24000-25000-26000-27000-280

16、00-29000-30000-310002499925999269992799928999299993099931999区间0 8 6 4 2 0 8 64202 11111>个<量数牌车车租出1偏态及其测度:偏态是对数据分布偏斜方向及程度的测度,偏态系数(分布偏斜程度的测度)计算公 式:k(Xi y)3Fia jja3N 3将对应区间出租车车牌数量进一步分组,Xi是组中值,3是组中值标准差的三次方,Fi为对应比重。在模型二(2)统计数据中16,18,,乃为对应区间出租车车牌数量,利用 EXCELS件可求得偏态系数a3 0.498 (求解过程见附录3)。由于偏态系数a3 0.498

17、 0,因此指定区间出租车车牌数量为左偏分布,即在总体区 问确定的情况下,推理说明机动车车牌号大多分布于前半区间24000,27999。2.峰度及其测度:峰度是分布集中于高峰的形态。它通常是与正态分布相比较来说的,在归化到同一方差时,若分布的形状比正态分布更瘦更高(太口语化),则称为尖峰,若比正态分布更矮更胖(太口语化),则称为平峰分布。峰度系数是离差四次方的平均数,再除以标 准差的四次方,其计算公式为:k(Xi y)4Fia,44 N 4式中:a表示峰度系数,4是标准差的四次方。已知正态分布的峰度系数为 3,当 a4 3时为尖峰分布,当a4 3时为扁平分布。在模型二(2)统计数据中16,18,

18、,乃为对应区间出租车车牌数量,利用 EXCELS件可 求得峰度系数a4 0.99(求解过程见附录3)。由于偏态系数a4 0.99 = 3,因此指定区间出租车车牌数量为扁平分布,且扁平程度 相当大,推理说明机动车车牌号趋于均匀分布,与题目所给数据随机性相符。七、模型评价优点:1、模型二在计算机动车牌号范围的区间时,分别用了点估计和极大似然估计法, 较为精确。2、对样本数据处理时,观测发现区间为 1000时的出租车牌号大致呈正态分布, 但模型二将数据通过SPSSa件验证,结果确为正态分布,这样就增加了模型 的精确程度。3、模型一简单易懂,计算简洁,具有直观性。缺点:1、模型一对机动车牌号范围的区间

19、估计不甚精确。2、模型没有考虑非本地的出租车的混入,从而对结果造成了误差。八、模型应用与推广基于以上模型的建立,我们得到了一个以给定一组样本数据为基准,来估计出总体数量的模型,并且还可以分析模型的可靠性,增加了模型的实用性。不难想象,可以将此模型应用于交通流量的测量、电器可靠性的分析、气象预报、质量检测等。九、参考文献11盛骤.概率论与数理统计,浙江大学,2001年12月第3版。21阮晓青.周义仓数学建模引论,高等教育出版社,2005年7月第一版。3http:/zh.wikipedia.org/wiki/%E5%BE%B7%E5%9B%BD%E5%9D%A6%E5%85%8B%E9%97%AE%E9%A2%98

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1