位置: IT常识 - 正文

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

编辑:rootadmin
猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数

推荐整理分享猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:北京猿创源科技有限公司,猿创设计科技有限公司,猿创教育,猿创教育,猿类的作文,猿文教育科技有限公司怎么样,猿类的作文,猿类的作文,内容如对您有帮助,希望把文章链接给更多的朋友!

这是机器未来的第44篇文章

原文首发地址:https://blog.csdn.net/RobotFutures/article/details/126615267

文章目录1. 概述2. 加载数据集3. 查看数据特征3.1 查看首5行数据3.2 查看数据集每个特征的最大值3.3 查看每个特征的最小值3.4 查看特征均值3.5 查看特征百分位数3.6 查看特征数据分布波动3.8 查看特征样本数量3.9 查看标签数据分布4. 其它常用的科学函数5. 总结1. 概述

本文以鸢尾花的数据预处理为例,描述了科学计算在机器学习使用的示例。

2. 加载数据集

以鸢尾花数据集为例。 鸢尾花数据集有4个特征,1个标签,特征为sepal_length,sepal_width,petal_length,petal_width,分别为花萼长度、花萼宽度,花瓣长度、花瓣宽度,标签为鸢尾花的分类,0,1,2分别代表山鸢尾(Setosa)、变色鸢尾(Versicolor)、维吉尼亚鸢尾(Virginical)

import numpy as npdata = []with open(file='iris.txt',mode='r') as f: f.readline() while True: line = f.readline() if line: data.append(line.strip().split(',')) else: breakdata = np.array(data,dtype=float)# 使用切片提取前4列数据作为特征数据X_data = data[:, :4] # 或者 X_data = data[:, :-1]# 使用切片提取最后1列数据作为标签数据y_data = data[:, -1]data.shape, X_data.shape, y_data.shape((150, 5), (150, 4), (150,))3. 查看数据特征3.1 查看首5行数据X_data[0:5], y_data[0:5](array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2]]), array([0., 0., 0., 0., 0.]))3.2 查看数据集每个特征的最大值# axis = 0指定X轴,取每列的最大值np.max(X_data, axis=0)array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每个特征的最大值,数据集的花萼长度最大值为7.9,花萼宽度最大值为4.4,花瓣长度最大值为6.9,花瓣宽度最大值为2.5

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

如果去掉轴axis参数,就是取数据集所有数据中的最大值,会综合所有列一起的最大值。

np.max(X_data)7.93.3 查看每个特征的最小值np.min(X_data, axis=0)array([4.3, 2. , 1. , 0.1])

上面的取值就是每个特征的最小值,数据集的花萼长度最小值为4.3,花萼宽度最小值为2,花瓣长度最小值为1,花瓣宽度最小值为0.1

3.4 查看特征均值np.mean(X_data, axis=0)array([5.84333333, 3.05733333, 3.758 , 1.19933333])3.5 查看特征百分位数

百分位数是统计中使用的度量,表示小于这个值的观察值样本数量占总体的百分比。

# 25%np.percentile(X_data, 0.25, axis=0)array([4.33725, 2.0745 , 1.03725, 0.1 ])# 50%np.percentile(X_data, 0.50, axis=0)array([4.3745, 2.149 , 1.0745, 0.1 ])# 75%np.percentile(X_data, 0.75, axis=0)array([4.4 , 2.2 , 1.11175, 0.1 ])3.6 查看特征数据分布波动np.std(X_data, axis=0)array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

从标准差可以看到特征花萼宽度标准差为0.43441097数据波动最小,花瓣长度标准差数据为1.75940407,数据波动最大。

3.8 查看特征样本数量X_data.shape(150, 4)

可以看到样本数量为150,每个样本4个特征

3.9 查看标签数据分布

通过np.unique分别获得唯一ID和对应的样本数量,然后通过zip、dict转换为字典。

unique, count = np.unique(y_data, return_counts=True)label_count = dict(zip(unique, count))label_count{0.0: 50, 1.0: 50, 2.0: 50}

可以看到标签是均衡的,每个分类的样本数均是50.

4. 其它常用的科学函数函数说明示例np.sum求累加np.sum((y_pred - y_data)**2)np.exp以自然常数e为底的指数函数np.exp**2np.var求方差np.var(X_data, axis=0)np.round四舍五入np.round(np.var(X_data, axis=0), decimals=2)np.square求平方np.square(X_data)np.abs求绝对值np.abs([1, -1, -7.9, 6])np.argmax求最大值的位置索引np.argmax(X_data, axis=0)np.argmin求最小值的位置索引np.argmin(X_data, axis=0)…5. 总结

以上就是numpy科学函数的简单介绍,更多api在将来的使用中再描述。

写在末尾:

博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。面向人群:AI初级学习者专栏计划:接下来会逐步发布跨入人工智能的系列博文,敬请期待Python零基础快速入门系列Python数据科学系列人工智能开发环境搭建系列机器学习系列物体检测快速入门系列自动驾驶物体检测系列…

本文链接地址:https://www.jiuchutong.com/zhishi/300866.html 转载请保留说明!

上一篇:OpenCV安装教程(全网最细,小白直接上手!!!)(opencv安装教程vs2019)

下一篇:Vue 和 React 有什么不同?(vue和react差别)

  • 心情低落说说发朋友圈短句(心情低落说说发朋友圈)(心情低落说说发朋友圈心烦的说说)

    心情低落说说发朋友圈短句(心情低落说说发朋友圈)(心情低落说说发朋友圈心烦的说说)

  • 苹果拉黑后怎么看拦截信息记录(苹果拉黑后怎么看拦截电话时间)

    苹果拉黑后怎么看拦截信息记录(苹果拉黑后怎么看拦截电话时间)

  • 小米项圈耳机充电灯不亮(小米项圈耳机充不进去电)

    小米项圈耳机充电灯不亮(小米项圈耳机充不进去电)

  • 强制关闭快捷键(游戏强制关闭快捷键)

    强制关闭快捷键(游戏强制关闭快捷键)

  • 处理器可以换吗(台式机处理器可以换吗)

    处理器可以换吗(台式机处理器可以换吗)

  • 如何取消待付款订单(信用卡如何取消自动扣款)

    如何取消待付款订单(信用卡如何取消自动扣款)

  • qq消息推送在哪里设置打开或者关闭(扣扣消息推送在哪里)

    qq消息推送在哪里设置打开或者关闭(扣扣消息推送在哪里)

  • 压缩文件已损坏是什么意思(压缩文件已损坏或压缩文件未知)

    压缩文件已损坏是什么意思(压缩文件已损坏或压缩文件未知)

  • 电脑登录微信显示未能登录是什么原因(电脑登录微信显示该账号已登录)

    电脑登录微信显示未能登录是什么原因(电脑登录微信显示该账号已登录)

  • 华为hms是什么系统(华为的hmscore是什么)

    华为hms是什么系统(华为的hmscore是什么)

  • access是一个什么系统(access到底是什么)

    access是一个什么系统(access到底是什么)

  • c语言中case啥意思(c语言case啥意思)

    c语言中case啥意思(c语言case啥意思)

  • 手机相册私密在哪里(手机相册私密相册在哪找到)

    手机相册私密在哪里(手机相册私密相册在哪找到)

  • 怎么下载b站视频到本地(怎么下载b站视频)

    怎么下载b站视频到本地(怎么下载b站视频)

  • 荣耀9x支持人脸解锁吗(荣耀9x支持人脸识别吗)

    荣耀9x支持人脸解锁吗(荣耀9x支持人脸识别吗)

  • 淘宝未读什么情况(淘宝的未读是真的吗)

    淘宝未读什么情况(淘宝的未读是真的吗)

  • kmeans原理(kmeans原理及计算过程)

    kmeans原理(kmeans原理及计算过程)

  • 为什么ip地址会被限制(为什么ip地址会显示别的城市)

    为什么ip地址会被限制(为什么ip地址会显示别的城市)

  • mpeg卡称什么(mpeg卡的功能不包括)

    mpeg卡称什么(mpeg卡的功能不包括)

  • 红米k20pro屏幕材料(红米k20pro屏幕什么材质)

    红米k20pro屏幕材料(红米k20pro屏幕什么材质)

  • 苹果手机微信怎么美颜视频聊天(苹果手机微信怎么分身)

    苹果手机微信怎么美颜视频聊天(苹果手机微信怎么分身)

  • jucheck.exe是什么进程  jucheck进程查询(kcleaner.exe是什么)

    jucheck.exe是什么进程 jucheck进程查询(kcleaner.exe是什么)

  • js中定义变量var 与 let的区别(js中定义变量关键词是)

    js中定义变量var 与 let的区别(js中定义变量关键词是)

  • 应交税费是什么科目
  • 生产成本怎么核实
  • 收到财政局拨款填到现金流量表哪一项
  • 专利年费是不是只能一项一项交
  • 去年科目记错如何调账
  • 税务机关和自然人属于平等主体吗
  • 企业资金运动包括哪几个环节
  • 定额发票遗失情况说明怎么写
  • 房地产开发商转型
  • 保险金扣税吗
  • 消费取得普通发票怎么开
  • 怎么办开户许可证
  • 小规模纳税人开专票税率是1%还是3%
  • 职工个人代扣款如何做账
  • 支付给其他公司费用怎么入账
  • 餐费可以入成本吗
  • 采用审计软件有什么优缺点
  • 小规模纳税人附加税会计分录
  • 合同负债属于什么费用
  • 先进行税务登记还是先注册开户银行账号
  • 股权质押权如何实现
  • 只交社保不发工资可以吗
  • 收回已核销的坏账并入账
  • 出租房子收入计入什么科目
  • 存货损失进项税
  • Linux系统怎么设置常亮
  • php array数组
  • 增值税发票半年后能冲红
  • 汽车消费税有发票吗
  • 装饰工程公司主要做什么
  • php数字增1
  • 假如你知道这样是什么歌
  • 企业所得税包含在税金及附加里面吗
  • python如何在画布上写字
  • 因质量原因退货和召回的产品,均应按照规定
  • 公司银行账号注销需要什么资料
  • 变卖废旧物资的增值税税率
  • 织梦cms可以商用吗
  • 织梦图片要放哪里
  • 企业所得税年报更正申报怎么操作
  • 员工加班打车费报销
  • 工会经费发放奖励个税处理
  • 成本和费用有着根本的区别
  • 对公付款对方不发货不退钱怎么处理
  • 房屋租赁合同印花税怎么交,一年一次吗
  • 在工资模块中进行各工资类别间的汇总
  • 普通发票做账需要价税分离吗
  • 应付票据转应付账款会计分录
  • 当月没认证发票有补救措施吗
  • 贴现凭证如何做账务处理
  • 员工工资怎么核算
  • 承兑汇票需要做账吗
  • 哪些收入不需要开票
  • 行政单位的财务报表包括哪些
  • 手续费和利息费用的区别
  • 新成立公司会计要做哪些事情
  • 装饰公司购买的安装服务怎么入账
  • 商业承兑汇票是什么
  • mysql 5.7.11 winx64安装配置教程
  • 如何获取数据库的sid
  • win10如何关闭windows安全中心图标
  • win8.1死机卡住不动
  • 怎么用winrar打包压缩文件
  • python pyo
  • js定义数字
  • 我吐槽你
  • jquery html5 视频播放控制代码
  • easyui表格
  • bootstrap-
  • Android百度地图定位 sdk 地理围栏监听
  • nodejs esmodule
  • android开发app
  • 歺包做法
  • UIAutomator在AndroidStudio中的使用
  • 北京税务跨区迁移不予受理,原因是什么
  • 车险专票怎么做账
  • 小微企业契税政策
  • 营改增后土地增值税
  • 跨境电商上什么货源好
  • 印花税核算有两种情况,是如何处理的?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设