共享单车运营分析及决策研究
共享单车运营分析及决策研究
张红, 周迪新, 程传祺, 沙毓
兰州理工大学计算机与通信学院,甘肃 兰州
摘要:针对共享单车运营过程中出现的分配不均衡和调度不合理的问题,基于某城市10个区域的共享单车骑行记录数据,综合应用时空统计及回归演绎分析和群智能算法,在分析共享单车时空分布特征的基础上,研究了基于蚁群算法的单车调度路径优化,设计了基于满足程度的共享单车区域最佳分配方案,并建立了共享单车投放量和打车人次间的回归模型,探讨了共享单车对打车市场的影响。研究结果对解决共享单车运营中存在的问题和提高共享单车运营效率及管理水平有重要的指导意义。
关键词:共享单车 ; 时空分布 ; 蚁群算法 ; 满足程度 ; 决策支持
论文引用格式:
张红, 周迪新, 程传祺, 沙毓. 共享单车运营分析及决策研究. 大数据[J], 2019, 5(1):87-97
ZHANG H,ZHOU D X, CHENG C Q, S Y. Study on and for -. Big data [J], 2019, 5(1): 87-97
1 引言
在全国倡导节能环保的大趋势下,方便、快捷又低碳的共享单车无疑是一种比较理想的出行方式。通过将共享单车与其他几种交通方式有机结合,不仅唤醒了因城市快速发展而不断萎靡的自行车市场,而且有效地解决了出行“最后一公里”的问题,缓解了道路拥堵和环境污染问题,引起了越来越多人的关注和认可。《2016中国共享单车市场研究报告》显示,截至2016年年底,中国共享单车用户数量达到1 886万;第42次《中国互联网络发展状况统计报告》显示,截至2017年年底,我国共享单车用户数增长到22 078万,到2018年6月,共享单车用户数增长到24 511万。共享单车的数量急剧增长共享单车对共享经济的启示,在回应公民需求、给公民出行带来便利的同时,也出现了乱停乱放、扰乱公共秩序、调度不合理等现象,这些现象加大了共享单车的运营和维护成本。因此,综合分析共享单车在运营过程中出现的各种问题,并为这些问题提供可行的解决方案,根据单车的运行情况和时空分布特点,合理规划单车的调度和投放方案,是共享单车良好运行和可持续发展的关键问题。根据文献资料,目前对共享单车的研究要么是对已有问题的宏观分析,如单车运营政策法规,要么是某一具体模型或算法在共享单车研究方面的应用,如单车站点需求量的预测、单车的优化调度,对共享单车运营过程中存在的具体问题、基于具体问题的建模和定量研究相对较少。基于单车运行过程中产生的大量轨迹数据,综合应用机理模型和数据驱动模型,对单车的运行时空分布特征以及基于具体时空分布的调度和投放方案等问题进行研究,并合理规划管理,是解决共享单车运营过程中出现的问题的主要有效措施。
因此,本文将以某城市10个区域的脱敏共享单车GPS定位数据为数据源,综合应用时空统计分析、回归演绎分析及智能蚁群算法,分析该地区共享单车的时空分布情况和运营状况,研究基于蚁群算法的共享单车优化调度和基于满足程度趋向的共享单车投放方案,并分析共享单车对打车市场的影响,以优化调度策略,合理规划共享单车的投放,提高共享单车的运营效率和管理水平,为共享单车的良性、可持续发展提供决策依据。
2 共享单车的时空分布特征
2.1 数据来源及预处理
本文数据来源于某地区10个区域1 000辆共享单车的骑行数据,共计11 649条记录,数据按时间顺序记载了每辆单车的骑行GPS定位情况,每条记录包括单车编号、骑行开始地点、骑行结束地点、骑行开始时间、骑行结束时间等字段。数据已经进行了脱敏处理,用1~10标识了单车出发或到达的区域地点。笔者首先对脱敏数据进行缺失值检测和修补,并基于箱线图检测异常值。因为该数据中检测出来的异常数据量很小,远少于原始数据量的百分之一,所以本文直接剔除了这些异常值。
2.2 可视化时空分布统计
本文利用数据统计分析软件R对骑行数据进行了时空统计分析,分别统计该地区10个区域每小时的共享单车使用量,统计时间为某天早晨6:00到深夜24:00,统计结果见表1,10个区域的每小时共享单车使用可视化折线图如图1所示。根据10个区域共享单车每小时使用分布折线图,重新按流量划分共享单车使用时间段(共7个时间段),可视化地展现了每个时间段10个区域的共享单车数量统计分布,如图2所示。
图110个区域每小时共享单车分布
图210个区域不同时段的共享单车数量统计
图1可以看出,10个不同区域的共享单车流量变化趋势大体相同,6:00—8:00共享单车使用人数急剧上升,8:00—12:00共享单车的使用量最高,12:00过后使用量渐渐减少,24:00左右使用量最低。由图2分析可知,相同时段,区域2、区域5和区域8的共享单车使用量比其他区域明显偏多,因此这3个区域应增加投放量,其中,区域8的共享单车使用量最多,应加强区域8的共享单车使用管理。
3 共享单车调度方案优化
共享单车的分布具有较强的时空特性,各个区域的共享单车使用量是不同的,同一区域不同时段的使用量也是不同的,合理调度共享单车是提高共享单车运营的关键因素。本文基于数据驱动,从单车使用量的时空变化特征出发,对单车的调度方案进行优化。
3.1 区域距离计算
以本体论认知理论为基础,本文描述了10个区域的概念设计以及概念间的相互关系,以增强对区域群体描述的精确性和一致性。当不考虑其他因素时,一般自行车的平均速度为18 km/h,统计共享单车样本数据中相同起讫点间的使用时间平均值,由此可计算基于本体论概念的区域间的距离,计算结果见表2。
3.2 区域相对位置确定
区域间的相对位置基于数学几何知识进行计算。在一个坐标系中,假设区域1的位置为点(6 000,6 000),那么区域2就在以区域1为圆心、以区域1与区域2之间的距离为半径的圆上,而区域3就在以区域1与区域2为圆心、以区域1与区域3和区域2与区域3的距离为半径的圆的交点上,以此类推,可以确定各个区域间的相对位置,如图3所示。当区域1的坐标位置确定后,其他区域的相对坐标位置如图4所示。
图3区域相对位置确定示意
图410个区域相对坐标位置
3.3 基于蚁群算法的优化调度
蚁群算法能够较好地利用概率模型优化多路径选择问题。本文基于蚁群算法研究了10个区域间共享单车的最优调度方案。在确定10个区域相对坐标位置的基础上,根据蚁群算法确定调度共享单车的最佳路径。建立蚁群算法模型:
其中,Q为正常数,Lk为第k只蚂蚁在本次周游中走过的路径的长度。
使用R软件,对10个区域建立了基于蚁群算法的优化调度方案,算法适应度进化曲线如图5所示,从图5可以看出,该算法收敛速度较快,优化后的单车调度路线如图6所示。通过对优化路径图与适应度进化曲线进行分析,若不考虑调度中心到第一个区域的路径,调度车一次遍历10个区域,调度共享单车的最优路径即最短距离为19 316.430 2 m,对应的区域调度次序为:区域9→区域2→区域4→区域6→区域3→区域1→区域7→区域5→区域10→区域8。
图5适应度进化曲线
图6优化路径
4 共享单车投放方案
4.1 宏观的单车满足程度需求模型
依据共享单车原来的投放量和实际使用量,本文建立了各个区域的共享单车供求模型,具体计算式如下:
C=d-s (2)
其中,C为共享单车的满足程度,d为共享单车需求量,s为实际提供的共享单车数量。当C>0时,表示该区域的共享单车实际需求量得不到满足,C越大,表示实际需求量越大;当C<0时,表示该区域实际需求共享单车已得到满足,|C|越大,表示该区域实际投放的共享单车剩余量越大,应该减少该地区的投放量。
10个区域的共享单车需求与实际供求量间的差值(即共享打车满足程度)见表3,如表3中的第2行第2列表示区域2需要向区域1调度的共享单车数量与实际可调度的共享单车数量的差值。共享单车满足程度趋向如图7所示,如图7中2→1表示区域2向区域1调度。
图7共享单车满足程度趋向(横坐标数字为区域编号)
由图7(a)可知,在2→1、4→3、5→4、6→5、7→6、8→7、8→10、9→8、10→9的调度中,共享单车存在较大缺口,并且缺口数量平均高达130辆左右。由图7(b)可知,在10→1、9→2、9→4、8→5、10→6、10→8、2→9、6→10的调度中,有剩余的共享单车,剩余量最高达30辆。根据区域间的共享单车满足程度,本文计算了满足程度比重,计算结果见表4。共享单车的投放可按照满足程度比重进行投放,合理调度共享单车,以满足人们的短距离出行需要。
4.2 微观的共享单车投放模型
根据共享单车的宏观满足程度需求模型,本文研究并设计了一种微观的单车投放模型。首先,跟踪记录每一辆共享单车每天的最早和最晚骑行时间节点所在的地区,得到该城市各地区每天的共享单车数量分布向量V(s)和V(e),则在第t个时段,各地区的共享单车实际数量分布向量为:
每个时段每个地区的具体单车数量计算式为:
其中,
表示第t个时段,骑进第i个地区共享单车的数量;
表示第t个时段,骑出第i个地区共享单车的数量,计算共享单车的数量变化矩阵表。再根据数量变化矩阵表,计算每个时段(这里为30 min)的共享单车租还比和需求占比。最后,根据需求占比,重新制定每个时段各地区的共享单车实际需求量,结合共享单车相对位置,制定出最终的共享单车微观投放方案,见表5,其中“无”表示不需要调度,宏观调度区域表示采用第4.1节模型调度的区域,微观调度区域表示采用第4.2节模型调度的区域。
5 共享单车对打车市场的影响
共享单车方便了人们的日常出行,它的出现对打车市场的影响比较大。为了研究共享单车对打车市场的具体影响共享单车对共享经济的启示,本文建立了打车人次与单车投放量的回归模型,假设x为共享单车投放量,y为打车人次,则建立的模型可表示为:
y=kx+c (5)
其中,k和c表示回归系数。根 据提供的数据,建立的回归方程及参数见表6,可决系数R2的值为0.954 1,回归方程较好地拟合了打车人数与单车投放量的变化关系,根据该模型,可得出随着共享单车投放量的增加打车人数呈递减趋势的结论。
为了进一步研究共享单车对打车市场的影响,统计了10个区域的共享单车骑行时间,如图8所示。从图8可以看出,大部分人的骑乘是短距离的,骑行时间为4~15 min,4.5 min左右的骑行量最大,骑行时间高于16 min的几乎没有。由此可得,共享单车是城市局部的微交通,共享单车的使用基本上是为了满足短距离出行的需要。因此,对于短距离出行而言,共享单车会对打车市场造成较大的冲击,而对于长距离出行而言,这种冲击较小。
图8共享单车骑行时间统计
本文研究了火车站和地铁附近的共享单车投放量与打车人数间的关系,如图9所示。可以看出,随着共享单车投放量的增加,打车人数呈递减趋势。另外,随着共享单车投放量的增加,地铁站打车人数下降得更快,说明相比火车站,地铁站附近的共享单车对打车市场的影响更大。在大城市中,人们的出行基本围绕着地铁站、城市中心发达的商业区及经济区展开,因此共享单车在地铁站、城市中心对打车市场的影响比较大,在城市的郊区及人口稀少的地方对打车市场的影响比较小。
图9共享单车投放量与打车人数的关系
6 结束语
基于某城市10个地区的共享单车行驶记录数据,本文对该城市10个地区的共享单车进行了时空分布可视化分析,从时间和空间两个角度统计分析了共享单车的分布情况,明确了共享单车使用比较频繁的时段和区域,以进行合理的共享单车投放管理。基于本体论理论,笔者设计了共享单车的区域相对位置计算方法,并用蚁群算法优化共享单车调度路径,使得调度车辆在一次遍历所有区域时经历的路线最短,以节约调度成本。同时,本文研究了各个区域共享单车的满足程度,并设计了基于满足程度的共享单车区域最佳分配方案。最后,建立了打车人与共享单车投放量的回归关系,以地铁站和火车站为主要区域,分析了共享单车对打车市场的影响。研究发现,骑行时间为4 min左右的共享单车对打车市场的影响最大,随着骑行时间的增加,这种影响逐渐减小,骑行时间超过16 min的共享单车对打车市场的影响非常小。
共享单车有利于公交衔接和解决“最后一公里”的交通问题,对提高城市交通水平和优化交通结构具有积极的意义。共享单车为新生事物,影响其良好运行的因素较多。本文综合应用多领域知识,比较系统全面地分析和研究了某地区共享单车的运营、调度、投放和对打车市场的影响等问题,是大数据背景下基于数据驱动研究事物运行规律、挖掘数据中隐藏的知识并提供有效决策支持的典型应用,也是对“互联网+”典型应用的一次比较全面的分析研究。该研究对于不断改进共享单车的管理、提高服务水平、促使其可持续发展具有重要的意义。
作者简介
张红(1977- ),女,博士,兰州理工大学副教授,主要研究方向为交通大数据、机器学习。
周迪新(1996- ),男,兰州理工大学本科生,主要研究方向为机器学习、数据挖掘。
程传祺(1995- ),男,兰州理工大学硕士生,主要研究方向为机器学习。
沙毓(1996- ),男,兰州理工大学本科生,主要研究方向为机器学习。
《大数据》期刊
《大数据(Big Data ,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的中文科技核心期刊。