kafka,presto,pinot,superset,grafana,K8s,docker
1.小米网的线上登陆、浏览、支付数据分析(数理统计、异动归因),对日常运营指标的监控和反欺诈等数据负责。
2.专项分析:如利用推荐算法预测客户购买趋势,进行个性化推荐。
3.线下门店仓储物流选址等分析。
小米之家线下门店零售沙盘项目:线下门店的选址规划的策略分析,利用宏观经济的经济指标、门店的人流量等指标为输入建立门店购买潜力的预测模型(线性拟合、时间序列), 并将模型预测结果展示在业务人员的APP端查看,以江苏省为试点,模型预测排名靠前的店铺最终在所有店铺中表现符合预期,在top10%。
小米商城复购率提升项目:利用数理统计和机器学习的分析结果,分析出客户购买商品的时间趋势上的概率密度,然后计算出活跃度等因素对复购率的影响和影响因素与复购率的数量关系,采用短信触达方式提升活跃度以此达到复购率提升的目的。项目使得活跃度提升10%,复购率提升1‰。
客户投诉问题分类项目:收集客户的投诉内容(text文本数据),通过jieba分词,利用naive bayes算法进行投诉内容的归类(二分类),经过数据清洗、分词、词频统计、预训练数据等过程,对文本进行分类,达到召回率0.97以上,准确率0.77。
系统健康状态监控及根因分析项目:利用trace数据把各模块调用关系和拓扑图展示出来,节点状态用系统监控的metrics通过异常提取,dependence去除,聚类和贝叶斯分类等模型来进行根因分析。grafana的dashboard 和charts实时展示系统状态。利用prefetch和Redis等工具处理大量数据,解决实时性的问题。
业绩:小米手机全球出货量第一,零售沙盘项目新建店面效果排名前10%。