位置: 编程技术 - 正文

python中常用的九种预处理方法分享(python九大特点)

编辑:rootadmin

推荐整理分享python中常用的九种预处理方法分享(python九大特点),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python的常用类型,python语言常用,python九大特点,python九大特点,python九大特点,python基本术语,python九大特点,python九大特点,内容如对您有帮助,希望把文章链接给更多的朋友!

本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;

1. 标准化(Standardization or Mean Removal and Variance Scaling)

变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。

一般会把train和test集放在一起做标准化,或者在train集上做标准化后,用同样的标准化器去标准化test集,此时可以用scaler

实际应用中,需要做特征标准化的常见情景:SVM

2. 最小-最大规范化

最小-最大规范化对原始数据进行线性变换,变换到[0,1]区间(也可以是其他固定最小最大值的区间)

3.规范化(Normalization)

规范化是将不同变化范围的值映射到相同的固定范围,常见的是[0,1],此时也称为归一化。

将每个样本变换成unit norm。

得到:

python中常用的九种预处理方法分享(python九大特点)

可以发现对于每一个样本都有,0.4^2+0.4^2+0.^2=1,这就是L2 norm,变换后每个样本的各维特征的平方和为1。类似地,L1 norm则是变换后每个样本的各维特征的绝对值和为1。还有max norm,则是将每个样本的各维特征除以该样本各维特征的最大值。在度量样本之间相似性时,如果使用的是二次型kernel,需要做Normalization

4. 特征二值化(Binarization)

给定阈值,将特征转换为0/1

5. 标签二值化(Label binarization)

6. 类别特征编码

有时候特征是类别型的,而一些算法的输入必须是数值型,此时需要对其编码。

上面这个例子,第一维特征有两种值0和1,用两位去编码。第二维用三位,第三维用四位。

另一种编码方式

7.标签编码(Label encoding)

8.特征中含异常值时

9.生成多项式特征

这个其实涉及到特征工程了,多项式特征/交叉特征。

原始特征:

转化后:

总结

标签: python九大特点

本文链接地址:https://www.jiuchutong.com/biancheng/385421.html 转载请保留说明!

上一篇:python 打印出所有的对象/模块的属性(实例代码)(python打印出none)

下一篇:浅谈python中的变量默认是什么类型(python 变参)

  • 国家电子产品投诉电话
  • 福利费属于管理费用的哪个明细
  • 持有待售固定资产按照账面价值与可收回金额
  • 广告费怎么入账
  • 预付账款冲销其他应付款法人吗
  • 招待费的进项
  • 个人开具工程款发票所得税怎么算
  • 纳税人状态怎么填写
  • 使用权资产什么时候开始使用
  • 滴滴普票可以抵扣进项么
  • 筹建期间所得税
  • 当月的销项税额要转入哪里
  • 押金收不回来了怎么处理
  • 电子商业汇票背书是什么意思
  • windows 10 bug
  • windows11怎么设置壁纸
  • 外贸企业汇兑损益要交所得税吗
  • 负债的情况
  • 出售报废固定资产的净损失计入什么科目
  • 电脑开机时出现用户账户控制提示
  • 企业缴纳职工社保政策
  • 缴纳房产税需要扣除折旧吗
  • 稳岗补贴怎么发放给员工
  • php中可用于设置变量类型的函数
  • 销售金额较大多少算较大
  • 如果收到房租的说说
  • php文件上传用什么请求方法
  • [JavaScript你真的以为这么简单吗]JavaScript高级
  • vue3安装配置
  • 14个Python处理Excel的常用操作,非常好用
  • 处置车辆收入缴税规定
  • 公司迁移到外省 税务局需要注销吗
  • python 虚拟环境
  • 已经申报过的个税在哪里查看
  • 打开的ps关不掉
  • 一般纳税人怎么申请纳税
  • 预收货款尚未发货
  • 购进销售农产品正常损耗怎么算
  • phpcms验证码不显示
  • python PaddleOCR库的介绍
  • 银行日记账跨月登记方法
  • 营业外收入汇算清缴时需要调增吗
  • 实发工资属于什么科目
  • 受托代销商品的成本结转
  • 所得税汇算清缴补税的会计处理
  • 小规模普票怎么开
  • 3%减按2%征收增值税是什么意思
  • 研发费用加计扣除的条件
  • 发票金额跟实际金额为什么不一样
  • 内部产生的商誉应确认为无形资产
  • 管道固定装置
  • 购进货物的发票确认定虚开,所得税处理
  • 企业取得的土地使用权用于自行开发建造厂房
  • 累计折旧怎么算出来
  • 开红字发票需要具备什么条件
  • 清除sql表内容
  • win2000 xp
  • win7怎么设置桌面位置
  • win7 便签
  • win10专业版注册表在哪里
  • Mac显示桌面快捷键
  • win10开启暗黑模式
  • WIN10系统安装.net报错0x80072f8F
  • win10系统如何查看
  • cocos资源释放
  • nodejs获取post数据
  • nodejs 代码加密
  • gitlab管理员账号 审批
  • 什么是Shell,shell作用
  • excel自定义样式
  • python迭代器的作用
  • js正则表达式变量
  • 批量ssh登录
  • Python内置的HTTP协议服务器SimpleHTTPServer使用指南
  • android获取手机的基本信息
  • jQuery插件安装教程
  • JavaScript为事件句柄绑定监听函数实例详解
  • 花都狮岭到广州白云站怎么坐车
  • 如何理解税收制度的含义
  • 电子税务局密钥不一致
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设