工作职责:
1、 通过判断司机是否安装抢单软件、抢单时长是否小于3s等等特征来建立
司机刷单分类模型,从而有效提示车队长进行司机管理,提升接单的公平性,
提升企业运营效率.
2、 首先对订单相关统计特征进行分箱处理,然后采用 WOE 进行特征变换,输
入到逻辑回归进行训练特征的权重,最后进行线性组合特征从而产生评分,
根据对订单评分排序后,直接用于派单决策,尝试过不同的模型来完成,
比如LR、RF、xgboost等等;后续考虑采用强化学习进行整体派单优化
3、 负责乘客推荐上车点模型设计,首先去除通过Dbscan聚类算法进行噪音
点剔除,然后使用kmeans聚类,把聚类中心作为上车推荐点,覆盖率提升
了30% ;
4、 把一天每 10 分钟切成一个时间片,并且对城市进行区域划分,考虑是否为
节假日以及天气状况,然后使用回归和时间序列对进行时空数据的司乘
gap供需预测;
5、 依照供需预测的结果,进行设计调度算法,一般考虑供需缺口比较大的区域
作为调度目标区域,然后根据距离和时间阀值来扫描周围的区域是否有空
闲的车辆可以调度,以最大化满足乘客的需求;
6、 负责拼车模型设计,首先会考虑设定拼车最大的绕路距离以及时间,然后通
过下单乘客的出发地和目的地粗选出可以拼车的乘客,然后再可拼车的乘
客进行二分图匹配,以降低乘客成本、并且平台利润最大化,高峰流水会提
高20%;
7、 负责司机异常行为的分析(离群值分析);
8、 使用用户的历史数据,比如一段时间的下单量,下单金额以及打开app的次
数等等特征来建立用户后付坏账的风险模型,平均日减少损失1万元;
9、 组织团队内部数据挖掘技术培训;