当前位置: 首页 > news >正文

沧州网站建设设计给金融公司群做网站合法吗

沧州网站建设设计,给金融公司群做网站合法吗,服装网站栏目调研,公司建网站多少钱qcjxkd机器学习模型预测贷款审批 作者#xff1a;i阿极 作者简介#xff1a;数据分析领域优质创作者、多项比赛获奖者#xff1a;博主个人首页 #x1f60a;#x1f60a;#x1f60a;如果觉得文章不错或能帮助到你学习#xff0c;可以点赞#x1f44d;收藏#x1f4c1;评论i阿极 作者简介数据分析领域优质创作者、多项比赛获奖者博主个人首页 如果觉得文章不错或能帮助到你学习可以点赞收藏评论关注哦 如果有小伙伴需要数据集和学习交流文章下方有交流学习区一起学习进步 大家好我i阿极。喜欢本专栏的小伙伴请多多支持 专栏案例机器学习案例机器学习(一)线性回归之最小二乘法机器学习(二)线性回归之梯度下降法机器学习(三)基于线性回归对波士顿房价预测机器学习(四)基于KNN算法对鸢尾花类别进行分类预测机器学习(五)基于KNN模型对高炉发电量进行回归预测分析机器学习(六)基于高斯贝叶斯对面部皮肤进行预测分析机器学习(七)基于多项式贝叶斯对蘑菇毒性分类预测分析机器学习(八)基于PCA对人脸识别数据降维并建立KNN模型检验机器学习(十四)基于逻辑回归对超市销售活动预测分析机器学习(十五)基于神经网络对用户评论情感分析预测机器学习(十六)线性回归分析女性身高与体重之间的关系机器学习(十七)基于支持向量机SVM进行人脸识别预测机器学习(十八)基于逻辑回归对优惠券使用情况预测分析机器学习(十九基于逻辑回归对某银行客户违约预测分析机器学习(二十)LightGBM算法原理附案例实战机器学习(二十一)基于朴素贝叶斯对花瓣花萼的宽度和长度分类预测机器学习(二十二)基于逻辑回归Logistic Regression对股票客户流失预测分析 文章目录 机器学习模型预测贷款审批1、前言2、导入库和数据集3、数据预处理和可视化4、分割数据集5、模型训练与评估总结 1、前言 贷款是现代世界的主要需求。仅此一点银行就获得了总利润的主要部分。它有利于学生管理他们的教育和生活费用也有利于人们购买任何类型的奢侈品如房子、汽车等。 但在决定申请人的个人资料是否与获得贷款相关时。银行必须照顾很多方面。 因此在这里我们将使用Python机器学习来简化他们的工作并使用婚姻状况、教育、申请人收入、信用记录等关键特征来预测候选人的个人资料是否相关。 该数据集包含 13 个特征 1贷款唯一的ID2性别申请人性别 男/女3已婚申请人的婚姻状况值为是/否4家属它告诉申请人是否有任何家属。5教育它将告诉我们申请人是否已毕业。6自雇这定义了申请人是自营职业者即是/否7申请人收入申请人收入8共同申请人收入共同申请人的收入9贷款额度贷款金额万10贷款金额_期限贷款期限月11信用_历史个人还款信用记录12物业_面积房产面积即农村/城市/半城市13贷款状态贷款状态是否已批准即 Y- 是、N- 否 2、导入库和数据集 首先我们必须导入库 Pandas – 加载数据框 Matplotlib – 可视化数据特征即条形图 Seaborn – 使用热图查看特征之间的相关性 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns data pd.read_csv(LoanApprovalPrediction.csv) 导入数据集后让我们使用以下命令查看它。 data.head(5)3、数据预处理和可视化 获取对象数据类型的列数。 obj (data.dtypes object) print(Categorical variables:,len(list(obj[obj].index)))由于 Loan_ID 是完全唯一的并且与任何其他列都不相关因此我们将使用 删除它。drop()函数。 data.drop([Loan_ID],axis1,inplaceTrue)使用barplot可视化列中的所有唯一值。这将简单地显示根据我们的数据集哪个值占主导地位。 obj (data.dtypes object) object_cols list(obj[obj].index) plt.figure(figsize(18,36)) index 1for col in object_cols: y data[col].value_counts() plt.subplot(11,4,index) plt.xticks(rotation90) sns.barplot(xlist(y.index), yy) index 1由于所有分类值都是二进制的因此我们可以对所有此类列使用标签编码器并且这些值将更改为int数据类型。 from sklearn import preprocessing label_encoder preprocessing.LabelEncoder() obj (data.dtypes object) for col in list(obj[obj].index): data[col] label_encoder.fit_transform(data[col])再次检查对象数据类型列。让我们看看是否还有剩余。 obj (data.dtypes object) print(Categorical variables:,len(list(obj[obj].index)))使用热力图显示了贷款金额和申请人收入之间的相关性。 plt.figure(figsize(12,6)) sns.heatmap(data.corr(),cmapBrBG,fmt.2f, linewidths2,annotTrue)明 Credit_History 对 Loan_Status 有很大影响。 现在我们将使用Catplot可视化申请人的性别和婚姻状况图。 sns.catplot(xGender, yMarried, hueLoan_Status, kindbar, datadata)现在我们将使用以下代码找出数据集中是否存在缺失值。 for col in data.columns: data[col] data[col].fillna(data[col].mean()) data.isna().sum()由于没有缺失值那么我们必须继续进行模型训练。 4、分割数据集 from sklearn.model_selection import train_test_split X data.drop([Loan_Status],axis1) Y data[Loan_Status] X.shape,Y.shape X_train, X_test, Y_train, Y_test train_test_split(X, Y, test_size0.4, random_state1) X_train.shape, X_test.shape, Y_train.shape, Y_test.shape((358, 11), (240, 11), (358,), (240,))5、模型训练与评估 由于这是一个分类问题因此我们将使用这些模型 K邻居分类器 随机森林分类器 支持向量分类器 (SVC) 逻辑回归 为了预测准确性我们将使用scikit-learn库中的准确性评分函数。 from sklearn.neighbors import KNeighborsClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.svm import SVC from sklearn.linear_model import LogisticRegression from sklearn import metrics knn KNeighborsClassifier(n_neighbors3) rfc RandomForestClassifier(n_estimators 7, criterion entropy, random_state 7) svc SVC() lc LogisticRegression() for clf in (rfc, knn, svc,lc): clf.fit(X_train, Y_train) Y_pred clf.predict(X_train) print(Accuracy score of , clf.__class__.__name__, ,100*metrics.accuracy_score(Y_train, Y_pred))输出 Accuracy score of RandomForestClassifier 98.04469273743017 Accuracy score of KNeighborsClassifier 78.49162011173185 Accuracy score of SVC 68.71508379888269 Accuracy score of LogisticRegression 80.44692737430168对测试集的预测 for clf in (rfc, knn, svc,lc): clf.fit(X_train, Y_train) Y_pred clf.predict(X_test) print(Accuracy score of , clf.__class__.__name__,, 100*metrics.accuracy_score(Y_test, Y_pred))输出 Accuracy score of RandomForestClassifier 82.5 Accuracy score of KNeighborsClassifier 63.74999999999999 Accuracy score of SVC 69.16666666666667 Accuracy score of LogisticRegression 80.83333333333333随机森林分类器给出了最好的准确度测试数据集的准确度得分为 82.5%。为了获得更好的结果还可以使用Bagging和Boosting等集成学习技术。 总结 在这里我们将使用Python机器学习来简化他们的工作并使用婚姻状况、教育、申请人收入、信用记录等关键特征来预测候选人的个人资料是否相关。 不要错过驾驭数据革命浪潮的机会每个行业都在利用数据的力量来攀登新的高度。磨练你的技能成为 21 世纪最热门趋势的一部分。 文章下方有交流学习区一起学习进步 首发CSDN博客创作不易如果觉得文章不错可以点赞收藏评论 你的支持和鼓励是我创作的动力❗❗❗
http://www.hkea.cn/news/14480890/

相关文章:

  • 网站成立时间查询平面设计广告公司
  • 怎么进行网站优化怎么才能免费建网站
  • 百汇游戏网站开发商外包装设计网站
  • 刷赞抖音推广网站网站规划与建设课程设计
  • 北京矿建建设集团有限公司网站wordpress官方主题库
  • 专门做恐怖的网站直播网站怎么建设
  • 新浪网站源代码从零开始学网站建设
  • linux 网站搬家网站模板html
  • 天津网站建设公司推荐微信网站在线登录网页版
  • 快速网站优化技巧做电脑网站用什么软件有哪些方面
  • 江苏网站建设价格潜江资讯网招聘信息2023年
  • 网站建制作公司北京科技网站制作
  • 自适应网站建设百度网盘网站入口
  • 小网站链接怎么找动漫制作app
  • 邢台建设专业网站泰安做网站哪里好
  • 芯火信息做网站怎么样免费拒绝收费网站
  • windows做网站服务器吗企业网站设计制作服务
  • 唐山做网站哪家好旅游电子商务网站的建设方式
  • 阜阳讯拓网站建设公司怎样申请网站
  • 内江市住房和城乡建设局网站电话号码硬件开发环境
  • 深圳罗湖企业网站建设报价网站开发及设计演讲海报
  • 怎样在在农行网站上做风险评估南京网站开发公司哪家好
  • 网站建设公司广告腾讯广告代理
  • 深圳网站制作与建设公司做网站的公司需要哪些资质
  • 加工厂网站建设论文小说网站的网编具体做哪些工作
  • 上海 企业网站建设wordpress 网站生成app
  • 东莞网站建设平台王占山将军简介
  • 延安市建设工程交易中心网站wordpress运营
  • 丽水网站建设明恩玉杰建设科技处网站
  • 天津微信网站建设摄影师作品网站有哪些