客户信用风险检测与预测数据科学与机器学习案例分析

数据挖掘 40

4.28MB 2024-07-18

#数据科学 # 机器学习 # 客户信用风险 # 数据分析 # 实习项目

这个项目源自暑期实习，所有代码和数据均公开，供数据分析初学者学习。项目通过描述性统计分析和数据处理，包括分类变量重编码、异常值识别和缺失值填补。模型方面采用了逻辑回归、glmnet惩罚逻辑回归、支持向量机等，并绘制了ROC曲线和混淆矩阵进行可视化。建议进一步尝试其他模型如分类树、随机森林、集成模型和神经网络以改进模型性能。