1、语意理解系统:公司电话营销场景中,通过ASR技术将语音转化为文本,然后基于Bert
实现语意理解系统,主要对客户说的每句话进行意图分类,支撑短信营销模块的模型。系
统主要包括:正则模块、分类模块、相似度模块,上线后准确率95%以上。用Tensorflow训
练,并用TF-Serving进行部署在docker。
2、短信营销:经过3轮迭代搭建了营销模型,通过对用户通话的文本内容进行语义理解得
到每一句话的意图,加上自有产品库的其他借贷特征,构建特征给XGB模型,挑选潜在客户
进行短信营销,上线后带来提现金额增加10%左右。
4、关系健康度模型:通过匹配用户本身、一度查询的特征,构建LGB模型,预估用户是否
是欺诈用户。模型最终在5个场景用户下KS均大于0.3,其中最好的达到0.45。符合金融场
景中比较好的模型的标准。
5、借贷意愿数据产品:根据统计特征,运用类似逻辑回归方法预估借贷意愿,在测试集
上10多个变量IV值大于0.2,符合预期。
6、借贷行为预估:根据用户过去半年的借贷数据,利用XGB、LSTM等模型预估未来7天是
否会发生借贷行为。准确率80%左右、召回率75%左右。
7、分位数数据产品:根据用户近1年的借贷申请记录,计算用户在不同时间窗口、不同类
别机构的借贷排名产出600多个特征,入模后KS提升个2点以上。
8、灰名单数据产品:类似于频繁项集的思路,识别欺诈的团伙,作为入模特征,供分析
师使用。
9、借贷意愿数据产品:类似于逻辑回归的思路,开发了用户借贷意愿预估的画像产品,
作为入模特征,供分析师使用。
10、工资信息提取:通过构造正则表达式,从目标文本中提取工资信息,准召98%左右。