
本文数据采集和统计分析的时间为2018年9月,部门数据的特点和结论可能与春运高峰时不一致。
想念胖家,春节想去冲浪。
没有火车票怎么办?
我们一起来看看12306的数据。
余票放行这件事有什么纪律吗?
这完全是性格问题
还有点纪律可循?
▍十行代码带你获得超过12,306张选票。
–通过url获取网络数据。
我们选择在12306网站上获取数据。
这个界面大家应该都不陌生。
然后右键单击页面空-查看元素。
在网络接口中找到请求url,其中包括剩余的票证信息。
我们用python做一个简单的数据清洗。
剩余的票证数据将被抓取以供娱乐。
–使用python构建剩余票据的自动抓取代码。
我们练习python的时间表库。
构建全天候运行的数据代码。
继续获取剩余的票证数据。
由于这里篇幅所限,我就不赘述了
▍有机会抢到什么样的火车票?
–有票大区域之间无票。
理论上任何时候都有机会抢到火车票,因为一旦有退票返回系统,12306基本都会实时返回余票仓。
这里说的抢票,是指长途大节票还有其他票剩下,开车时间比较短。铁路部门想降低空装载率,实现利润最大化,所以把长途车票留下来卖。
举个栗子:
小长假想去平遥古城玩两天,先看看火车票:
系统显示G627的二等座全部售完,只剩一个一等座。去平遥古城是不可能的吗?当然不是,我们发现平遥古城不是终点站,火车的终点站是运城北。
搜北京到运城北看效果;
如何利用社群进行推广,做好社群营销推广技巧?
效果显示北京到运城北有余票,余票99张以上。在这里,我们先做一个勇敢的预测。铁路部门认为全程剩余车票卖不完。为了降低空装载率,在可以开售的情况下,会放出大量余票。接下来我们来验证一下,看看这些余票是怎么放出的。
▍大数据来分析余票的时间。
由于12306的改版,当余票数量跨越20张时,不会显示为“是”,但实际上在12306购票提交前,系统仍会提醒实际余票数量。
但是登陆时间长了,爬虫容易对账号产生不好的影响。所以建议还需要爬实际票数的朋友认真一点,退一步选择其他代销网站。像往常一样,剩余票数可以显示到99。
感谢郑涛先生为我们提供了准确的余票信息来源数据。数据是持续七天的同一天剩余火车票数量,采集距离为一分钟。我们来讨论一下剩余火车票的发售方式。
–统一列车,不同车站放票时间一样吗?
同一列车不同车站的放票时间是否相同,即放票时间是否与车站有关。为了验证这个问题,我们选取了D306统一日,对三个板块的剩余票数进行了分析比较。
效果很明显。我们发现三个区段站的放票时间都集中在中午12点和第二天18点30分,三个区段站之间没有显著差异,也就是说这一趟列车剩余车票的放票时间基本不会因为车站的不同而不同。
–统一车次,不同日期放票时间一样吗?
我们以D306为例,看看持续了三天的D306的余票信息。
我们可以看到,虽然三天的余票数量不尽相同,但是每天18:25-18:30都有大量的余票放出,三天的放票时间非常接近,所以D306上海到南京的放票时间在这三天是比较坚定的。
这是普遍现象,那么举个例子?我们把时间拉长一点,看看七天的数据是否还符合这个规律。
从表中可以看出,答案是肯定的,不同日期D306次列车的余票发售时间基本相同。让我们看看其他的火车。
此外,边肖还对G1252-宿州至无锡、G7072-丹阳至南京、G7244-无锡至镇江等20趟日期不同的列车当天余票的发售情况进行了考察,发现上述20趟列车的发售时间也有相对确定的时刻。
那么,我们能提前多长时间拿到剩余的票呢?
我们把这20趟列车的“出发-放票时间”做个直方图,看看有没有规律。
从以上数据来看,每趟列车的放票时间不同,但我们发现了两个数据集异常的区段,分别是发车前7小时(420分钟)和1小时(60分钟)。我们可以在实际抢票过程中重点关注这两个时间段。
我们来看一下这20趟列车每天售票的时间差,做一个方框图。发现大部分部门出票日的时间差很小,与我们之前个别数据的规律基本一致。
总结与展望
1.通过对这一样本数据的分析发现,余票发售时间与车站没有直接关系,而是随车票而异。
2.在大面积有票的情况下,小区之间出票的时间比较坚定。这个时间是存在的,只是随车次不同而变化,不受12306网站停站服务的影响。在大多数情况下,现在还不是时候。比如上午9点发车的D3022,天亮2点左右就要出票。在确认大区段有票的情况下,提前7小时和1小时检查列车的放票情况,更有可能查出车辆的放票时间。
3.余票分析仅限于当天9-24小时的放票分析,势必有一定的局限性。由于现在预售期是30天,边肖会持续关注,有了更完整的放票策略,我会实时分享给大家!
我想进行一次徒步旅行
还有哪些抢票的小技巧?
1.12306每天早上6点开始售票。不管晚上是不是火车放余票的时间,还是有人在火车站退票改签。早上6点是网上售票的开始时间,他们可以抢到昨晚积攒的余票。
2.关于第三方抢票软件,我想分享一下我的简历。为了让游客购买流量叠加套餐,软件会显示区间内抢票人数,热门道路有上千条。你排名第几?当然,第三方软件也帮我抢到了不少火车票,抢票软件的好处是异常节省时间。但在部门热门,边肖亲身经历了软件不抢票,手动抢票的简历。
3.先说两个与工艺无关的纯简历。第一,高铁买短途票,短间隔还有票,长间隔基本没票。在船上采取措施补票是可以接受的。
4.跨节购票,非常明显的是苏州和杭州在本科阶段回北京实习,苏州到北京的卧铺票基本没有。相反,大家都购买了上海到北京的区间。在价格差不多的当下,也可以考虑跨节购票。