加入收藏 | 设为首页 | 会员中心 | 我要投稿甘孜站长网（https://www.0836zz.com.cn/）- 运维、物联设备、数据计算、智能推荐、云管理!

当前位置：首页 > 运营中心 > 建站资源 > 经验 > 正文

机器学习的正则化是什么意思？

发布时间：2019-10-20 23:16:30 所属栏目：经验来源：佚名

导读：经常在各种文章或资料中看到正则化，比如说，一般的目标函数都包含下面两项其中，误差/损失函数鼓励我们的模型尽量去拟合训练数据，使得最后的模型会有比较少的 bias。而正则化项则鼓励更加简单的模型。因为当模型简单之后，有限数据拟合出来结果的随机性

副标题[/!--empirenews.page--]

机器学习的正则化是什么意思？

经常在各种文章或资料中看到正则化，比如说，一般的目标函数都包含下面两项

机器学习的正则化是什么意思？

其中，误差/损失函数鼓励我们的模型尽量去拟合训练数据，使得最后的模型会有比较少的 bias。而正则化项则鼓励更加简单的模型。因为当模型简单之后，有限数据拟合出来结果的随机性比较小，不容易过拟合，使得最后模型的预测更加稳定。

但一直没有一篇好的文章理清到底什么是正则化？

说到正则化，得先从过拟合问题开始谈起。

1) The Problem of Overfitting(过拟合问题)

拟合问题举例-线性回归之房价问题：

a) 欠拟合(underfit, 也称High-bias，图片来源：斯坦福大学机器学习第七课“正则化”)

机器学习的正则化是什么意思？

b) 合适的拟合：

机器学习的正则化是什么意思？

c) 过拟合(overfit,也称High variance)

机器学习的正则化是什么意思？

什么是过拟合(Overfitting):

如果我们有非常多的特征，那么所学的Hypothesis有可能对训练集拟合的非常好(

机器学习的正则化是什么意思？

)，但是对于新数据预测的很差。

过拟合例子2-逻辑回归：

与上一个例子相似，依次是欠拟合，合适的拟合以及过拟合：

a) 欠拟合

机器学习的正则化是什么意思？

b) 合适的拟合

机器学习的正则化是什么意思？

c) 过拟合

机器学习的正则化是什么意思？

如何解决过拟合问题：

首先，过拟合问题往往源自过多的特征，例如房价问题，如果我们定义了如下的特征：

机器学习的正则化是什么意思？

那么对于训练集，拟合的会非常完美：

机器学习的正则化是什么意思？

所以针对过拟合问题，通常会考虑两种途径来解决：

a) 减少特征的数量：

-人工的选择保留哪些特征；

-模型选择算法

b) 正则化

-保留所有的特征，但是降低参数机器学习的正则化是什么意思？的量/值；

-正则化的好处是当特征很多时，每一个特征都会对预测y贡献一份合适的力量；

所以说，使用正则化的目的就是为了是为了防止过拟合。

机器学习的正则化是什么意思？

如上图所示，红色这条想象力过于丰富上下横跳的曲线就是过拟合情形。结合上图和正则化的英文，直译应该叫规则化。

什么是规则？比如明星再红也不能违法，这就是规则，一个限制。同理，规划化就是给需要训练的目标函数加上一些规则（限制），让它们不要自我膨胀，不要过于上下无规则的横跳，不能无法无天。

机器学习的正则化是什么意思？

L1正则化和L2正则化

机器学习中几乎都可以看到损失函数后面会添加一个额外项，常用的额外项一般有两种，一般英文称作ℓ1-norm和ℓ2-norm，中文称作L1正则化和L2正则化，或者L1范数和L2范数。

L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。

对于线性回归模型，使用L1正则化的模型建叫做Lasso回归，使用L2正则化的模型叫做Ridge回归（岭回归）。

下图是Python中Lasso回归的损失函数，式中加号后面一项α||w||1即为L1正则化项。

机器学习的正则化是什么意思？

（编辑：甘孜站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1

相关内容

推荐文章

网站添加社会化标签有	百度站长工具怎么分析
为什么要建手机网站？	怎么看网站是否启动CD

站长推荐

热点阅读