博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
特征缩放
阅读量:5273 次
发布时间:2019-06-14

本文共 614 字,大约阅读时间需要 2 分钟。

Feature Scalling

Idea: Make sure features are on a similar scale

特征缩放

想法:确保所有的特征在相似的范围


为什么进行特征缩放?

例如:x1 = size (0-2000 feet2)

        x2 = number of bedrooms (1-5)

x1和x2范围相差很大

算法需要很长时间才能到达最小值

如果把x1和x2做如下处理

\[{x_1} = \frac{

{
{x_1}}}{
{2000}}\]

\[{x_2} = \frac{

{
{x_2}}}{5}\]

x1和x2的范围会变为[0, 1]

则图形会变为如下所示

这样做可以让算法收敛更快

其实,特征的范围不一定要在一个范围内,相差不多就可以


Mean normalization

Replace xi with xi-ui to make features have approximately zero mean (Do not apply to x0 = 1)

替换xi为xi-ui,使特征具有近似零均值

一般情况下使用如下公式 \[{x_i} = \frac{

{
{x_i} - {\nu _i}}}{
{
{x_{i\_\max }} - {x_{i\_\min }}}}\]

 

转载于:https://www.cnblogs.com/qkloveslife/p/9833310.html

你可能感兴趣的文章
关于本博客说明
查看>>
[Kaggle] Sentiment Analysis on Movie Reviews
查看>>
价值观
查看>>
mongodb命令----批量更改文档字段名
查看>>
国外常见互联网盈利创新模式
查看>>
android:scaleType属性
查看>>
shell脚本
查看>>
Upload Image to .NET Core 2.1 API
查看>>
【雷电】源代码分析(二)-- 进入游戏攻击
查看>>
Linux中防火墙centos
查看>>
如何设置映射网络驱动器的具体步骤和方法
查看>>
centos下同时启动多个tomcat
查看>>
Leetcode Balanced Binary Tree
查看>>
[JS]递归对象或数组
查看>>
linux sed命令
查看>>
湖南多校对抗赛(2015.03.28) H SG Value
查看>>
hdu1255扫描线计算覆盖两次面积
查看>>
hdu1565 用搜索代替枚举找可能状态或者轮廓线解(较优),参考poj2411
查看>>
程序存储问题
查看>>
优雅地书写回调——Promise
查看>>