经过12月上半旬的半个月的激战,这次比赛的成绩并不理想,但是作为第一次参与的这样的正式的比赛也算学习到比较多的知识了,时间没有白费。将所写的代码进行重构,顺便参考一位排名17选手的开源代码和提特征思路;同时记录这个过程,我想这有助于不会写竞赛baseline代码的同学参考。
本次对代码进行重构的过程中也学习同不少知识,同时也对之前的竞赛提取特征思路进行了一些修正,使线下成绩有了不少提升;比如仅使用 t_user.csv 和 t_loan.csv两个文件就能使线下成绩达到 1.7929,在比赛的时候就听说可以仅使用这两张表就可以达到1.80,1.79,当时觉得挺难,没想到将自己的代码改一下也可以达到;另外再加上 t_order.csv和 t_click.csv这两个表的单表特征(没有提取交叉特征)成绩就可以提升到1.7877(还没有经过调参和模型融合)。