摘要: 初识pyecharts: 什么是pyecharts? pyecharts=python+echarts 而Echarts 是一个由百度开源的数据可视化工具,有着良好的交互性,精巧的图表设计能力。当Python与Echarts结合就形成了pyecharts. 有了matplotlib和seaborn为 阅读全文
posted @ 2021-08-04 17:33 瑶池里 阅读(1461) 评论(0) 推荐(0) 编辑
摘要: a56爆大奖在线娱乐们还是用相亲网站的数据来建立模型预测一个人是否约会成功: 根据大数定律a56爆大奖在线娱乐们知道当数据足够多的时候频率等于概率,a56爆大奖在线娱乐数据越大,a56爆大奖在线娱乐们用贝叶斯算法预测的越准确 > ##加载数据集:相亲网站约会数据 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > Da 阅读全文
posted @ 2020-11-14 12:13 瑶池里 阅读(452) 评论(0) 推荐(0) 编辑
摘要: a56爆大奖在线娱乐们拿一个婚恋网站的数据来做knn模型:自变量收入、吸引力、资产,教育和是否约会成功。a56爆大奖在线娱乐们利用这些数据做一个小的预测约会是否成功的模型 > ##加载数据集 > Data<-read.csv("date_data2.csv") > #数据需要标准化 > x<-scale(Data[,c(1,2,3,4 阅读全文
posted @ 2020-11-13 23:36 瑶池里 阅读(989) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-11-13 12:01 瑶池里 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-11-13 11:15 瑶池里 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 层次聚类 1、定义每一个观测量为一类 2、计算每一类与其他各类的距离 3、把距离最短的两类合为一类 4、重复步骤2和3,直到包含所有的观测量合并成单类时 > ##########################聚类算法 > ####层次聚类 > par(mfrow = c(1,1)) > data( 阅读全文
posted @ 2020-11-04 17:43 瑶池里 阅读(3639) 评论(0) 推荐(0) 编辑
摘要: C5.0 > ###########################决策树 > ########C5.0 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > orgdata<-read.csv("Allelectronics.csv") > summ 阅读全文
posted @ 2020-11-04 17:26 瑶池里 阅读(623) 评论(1) 推荐(0) 编辑
摘要: > ###############逻辑回归 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > accepts<-read.csv("accepts.csv") > names(accepts) [1] "application_id" "accou 阅读全文
posted @ 2020-11-04 14:06 瑶池里 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 前文a56爆大奖在线娱乐们讲到线性回归建模会有共线性的问题,岭回归和lasso算法都能一定程度上消除共线性问题。 岭回归 > #########正则化方法消除共线性 > ###岭回归 > ###glmnet只能处理矩阵 > library(glmnet) > library(mice) > creditcard_ex 阅读全文
posted @ 2020-11-04 11:29 瑶池里 阅读(5952) 评论(0) 推荐(0) 编辑
摘要: > ############################################线性回归 > setwd("/Users/yaozhilin/Downloads/R_edu/data") > creditcard_exp<-read.csv("creditcard_exp.csv") > 阅读全文
posted @ 2020-11-04 10:46 瑶池里 阅读(606) 评论(0) 推荐(0) 编辑