python机器学习之(sklearn)岭回归

1.岭回归今天看了会L2正则化，大致的意思就是在惩戒函数中加入高次项的惩戒项，用来减小线性回归中高次项的系数，避免过拟合的状态。这样就产生了一种具有正则化的线性回归模型------岭回归。2.岭回归在sklearn中的apisklearn.linear_model.Ridge(alpha=1.0)#具有正则化的线性最小二乘法#alpha 表示正则化力度#coel_ 表示回归系数from sklea

柳小葱

6523人浏览 · 2020-10-06 23:33:09

柳小葱 · 2020-10-06 23:33:09 发布

1.岭回归

今天看了会L2正则化，大致的意思就是在惩戒函数中加入高次项的惩戒项，用来减小线性回归中高次项的系数，避免过拟合的状态。这样就产生了一种具有正则化的线性回归模型------岭回归。

2.岭回归在sklearn中的api

sklearn.linear_model.Ridge(alpha=1.0)
#具有正则化的线性最小二乘法
#alpha 表示正则化力度
#coel_ 表示回归系数

from sklearn.linear_model import Ridge

3.岭回归模型案例

 # 岭回归降求解预测结果
 ri = Ridge(alpha=1.0)#实例化岭回归对象
 ri.fit(x_train, y_train)#输入训练数据
 print("特征值", ri.coef_)
 # 预测测试集的房子价格
 ri_y_predict = std_y.inverse_transform(ri.predict(x_test))
 print("梯度下降每个房子的预测价格:", ri_y_predict)
 print("正规方程均方误差：", mean_squared_error(std_y.inverse_transform(y_test), y_predict))
 print("梯度下降均方误差：", mean_squared_error(std_y.inverse_transform(y_test), SGD_y_predict))
 print("岭回归误差：", mean_squared_error(std_y.inverse_transform(y_test), ri_y_predict))

结果如下：（看着结果确实是好一点）

在这里插入图片描述

最后附上全部代码：正规方程，梯度下降和岭回归模型

from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression,SGDRegressor
from sklearn.linear_model import Ridge
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error


def regress():
  # 获取数据
  lb = load_boston()
  # 分割数据集为训练集和测试集
  x_train, x_test, y_train, y_test = train_test_split(lb.data, lb.target, test_size=0.25)
  # 进行标准化处理，特征值和目标值都需要分别进行特征化处理
  # 特征值进行标准化
  std_x = StandardScaler()
  x_train = std_x.fit_transform(x_train)
  x_test = std_x.transform(x_test)
  # 目标值进行标准化
  std_y = StandardScaler()
  y_train = std_y.fit_transform(y_train.reshape(-1,1))
  y_test = std_y.transform(y_test.reshape(-1,1))
  # estimator预测
  #正规方程求解方式预测结果
  lr = LinearRegression()
  lr.fit(x_train, y_train)
  print("特征值：",lr.coef_)
  # 预测测试集的房子价格
  y_predict = std_y.inverse_transform(lr.predict(x_test))
  print("正规方程求解每个房子的预测价格:",y_predict)

  #梯度下降求解预测结果
  SGD=SGDRegressor()
  SGD.fit(x_train, y_train)
  print("特征值",SGD.coef_)
  # 预测测试集的房子价格
  SGD_y_predict = std_y.inverse_transform(SGD.predict(x_test))
  print("梯度下降每个房子的预测价格:", SGD_y_predict)



  # 岭回归降求解预测结果
  ri = Ridge(alpha=1.0)
  ri.fit(x_train, y_train)
  print("特征值", ri.coef_)
  # 预测测试集的房子价格
  ri_y_predict = std_y.inverse_transform(ri.predict(x_test))
  print("梯度下降每个房子的预测价格:", ri_y_predict)
  print("正规方程均方误差：", mean_squared_error(std_y.inverse_transform(y_test), y_predict))
  print("梯度下降均方误差：", mean_squared_error(std_y.inverse_transform(y_test), SGD_y_predict))
  print("岭回归误差：", mean_squared_error(std_y.inverse_transform(y_test), ri_y_predict))
  return None
if __name__ == "__main__":
  regress()

技术共进，成长同行——讯飞AI开发者社区

更多推荐

AI智能体—人工智能工作流与人工智能智能体：真正的区别是什么？

本文探讨了人工智能工作流与智能体的核心区别。工作流是静态、可预测的执行序列（如预处理→嵌入→搜索→总结），适合批处理作业；而智能体能动态感知环境、自主决策（感知→推理→决策循环），具备适应性和工具选择能力。关键差异在于：工作流遵循固定路径，智能体则能根据目标调整策略。架构上，工作流使用Airflow等工具，智能体依赖LangChain等框架。智能体的自主性使其更适用于动态环境，代表下一代AI应用方