美联航的暴力逐客事件的发生,引起了全球,尤其是亚裔群体的集体愤怒的声讨,这里不必多说。这个事件不
美联航的暴力逐客事件的发生,引起了全球,尤其是亚裔群体的集体愤怒的声讨,这里不必多说。这个事件不经意的暴露了航空业多年来实践的一个潜规则,机票超卖。
机票超卖,就是在售票时,考虑到有乘客,由于种种原因,不能及时赶到的情况,销售的票数超过飞机座位的情况。如果你经常乘机旅行,例如笔者常年乘坐的北京至深圳航线(热线),常存在空座的情况,飞机的最后一二排,甚至都空着。
超卖机票存在着可观的利润空间,这是显而易见的,航空公司非常有动力这么做。这也能从另外一个角度解释了长期困惑我的问题:为什么飞机而且仅有飞机,需要值机选座,而不是像火车、轮船一样在买票时就能确定了座位?
如何在利润最大化的情况下减少超卖的风险呢?这需要一个简单的数学模型,任何人,有一定的统计学基础和excel软件,完成这个看似不可能的任务。Talk is cheap,let’s code。码农们!
乘客错过飞机的理由会千奇百怪,我先做个假设,每个乘客都有1.5%的机会错过飞机,即错失率为1.5%。这个要出售机票的飞机有300个座位,这是个大飞机哦!售票的manager,要制定售票数量策略,使得飞机的入座率99%以上(最多三个空座),多卖票的同时最大限度减少乘客超额的数量。这次manager比较乐观,决定多卖17张,这不是个小数目。我们看会发生什么?
可以假设乘客之间是独立的,就是相互之间没影响。那么每个人能及时登机的概率是100%-1%=99%,错失的概率是1%。在概率里是个典型的二项分布,哈哈,其实实际远没有听起来那么难!拿投硬币举例,二项分布就是描述:比如说投100次,成功次数的概率。当然50正面50个反面的概率最高,现实中存在90正面10反面的可能,就是概率低些。
这里先假设manager,很冲动的卖出317张票。我把问题就归结为,这买了票的317人,至少有多少个能出现的概率问题,有点绕!还好吧。
先上图,这个model是在excel中实现,excel里有二项分布函数。
函数的使用说明具体看excel的函数帮助。它计算的目的,可以描述为至少会有297位(99%的上座率)能成功赶上飞机的概率,这里是1,鉴于多买了17张票,可以肯定出现的乘客会多于297人,不仅如此,后面的计算显示:出现多于,比如说307人的概率为0.9996,这能得出肯定有多于307赶上乘机;出现多于313人的概率是0.7867,这个概率也比较大,由此不难得出结论,机组人员很可能面对13个有票却无法登机的愤怒乘客;同时也存在更坏的情况,有315人来乘机,只是可能性小一点,0.3850。
有洞察力的读者可能会提出核心问题,就是我对乘客错失率的假设1%怎么得到的?是不是合理?这是一个最重要的假设!我的假设来自:能够使用历史数据来对航线的错失率进行估计;但是,这个错失率很可能不是固定的,会受到节日、公共事件、季节等因素的影响。下面我加强完善Model,把判断权交给售票manager,同时也给model增加一些实用性。
manager能够最终靠上面的计算调整售票策略。如果近来错失率较低,比如说近似0.5%,303的概率0.6337,超3人比较大,305,0.1889,超5人的可能性比较小。判断可能有3~5个人无法乘机,对航空公司来说,这个情况是不是能够接受,弥补的成本是否能被超卖的利润cover?这要留个售票manager考虑了。
如果错失率比较高,比如说2.25%。你会发现超过300人的概率为0.312805,比较低,很也许会出现空位的情况,这时售票manager可优先考虑增加超卖的票数了。
使用相似的方法,可以在固定错失率的基础上,分析超卖票数变化的情况下乘客的概率,如下图
如果售票manager在确定了错失率为1.5%的情况下,超卖带来的后果。超卖4张是比较安全的,超过300个乘客出现的概率为0.330325,比较小。
这是数据科学领域中统计分布的一个实际应用。当然这个模型还很简单,对实际的复杂场景做了一些简化,从某个角度展示了数据科学模型的应用潜力,这些潜力,隐藏在我们日常工作和生活的场景里。返回搜狐,查看更加多