博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习模板
阅读量:4641 次
发布时间:2019-06-09

本文共 1184 字,大约阅读时间需要 3 分钟。

根据心情补充,语言都是Python

hash,把所有的文本转化成数字

from sklearn.preprocessing import LabelEncoderfor c in train.columns:    if train[c].dtype == 'object':        lbl = LabelEncoder()        lbl.fit(list(train[c].values) + list(test[c].values))        train[c] = lbl.transform(list(train[c].values))        test[c] = lbl.transform(list(test[c].values))

Xgboost训练

'''Train the xgb model then predict the test data'''

xgb_params = {    'n_trees': 520,     'eta': 0.0045,    'max_depth': 4,    'subsample': 0.93,    'objective': 'reg:linear',     'eval_metric': 'rmse',    'base_score': y_mean, # base prediction = mean(target)    'silent': 1}# NOTE: Make sure that the class is labeled 'class' in the data filedtrain = xgb.DMatrix(train.drop('y', axis=1), y_train)dtest = xgb.DMatrix(test)num_boost_rounds = 1250# train modelmodel = xgb.train(dict(xgb_params, silent=0), dtrain, num_boost_round=num_boost_rounds)y_pred = model.predict(dtest)

OneHot矩阵转换

enc = OneHotEncoder(handle_unknown='ignore')enc=enc.fit(pd.concat([X[categorical],X_test[categorical]]))X_cat_sparse=enc.transform(X[categorical])X_test_cat_sparse=enc.transform(X_test[categorical])

转载于:https://www.cnblogs.com/qscqesze/p/7053740.html

你可能感兴趣的文章
POJ 1579 Function Run Fun 记忆化递归
查看>>
股票质押式回购交易是利好还是利空
查看>>
idea+Spring+Mybatis+jersey+jetty构建一个简单的web项目
查看>>
centos使用epel yum源
查看>>
IE常见BUG总结(持续更新)
查看>>
php 文件操作
查看>>
Java内存区域划分、内存分配原理(转)
查看>>
6.5日讲课——dp动态规划
查看>>
16.2 【C# 5】调用者信息特性
查看>>
Spring之IOC容器加载初始化的方式
查看>>
1 为什么搭建.Net core下的云开发框架
查看>>
Java安全防御学习笔记V1.0
查看>>
Python时间和日期
查看>>
oracle 11g ocp 笔记(26)--全球化
查看>>
bzoj3712: [PA2014]Fiolki
查看>>
asp.net 淘宝api获取商品信息
查看>>
宏_CRTIMP分析
查看>>
ubuntu创建、删除文件及文件夹,强制清空回收站方法
查看>>
jmeter参数化之CSV Data Set Config
查看>>
Cobbler--自动化部署
查看>>