位置: IT常识 - 正文

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

编辑:rootadmin
猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数

推荐整理分享猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:北京猿创源科技有限公司,猿创设计科技有限公司,猿创教育,猿创教育,猿类的作文,猿文教育科技有限公司怎么样,猿类的作文,猿类的作文,内容如对您有帮助,希望把文章链接给更多的朋友!

这是机器未来的第44篇文章

原文首发地址:https://blog.csdn.net/RobotFutures/article/details/126615267

文章目录1. 概述2. 加载数据集3. 查看数据特征3.1 查看首5行数据3.2 查看数据集每个特征的最大值3.3 查看每个特征的最小值3.4 查看特征均值3.5 查看特征百分位数3.6 查看特征数据分布波动3.8 查看特征样本数量3.9 查看标签数据分布4. 其它常用的科学函数5. 总结1. 概述

本文以鸢尾花的数据预处理为例,描述了科学计算在机器学习使用的示例。

2. 加载数据集

以鸢尾花数据集为例。 鸢尾花数据集有4个特征,1个标签,特征为sepal_length,sepal_width,petal_length,petal_width,分别为花萼长度、花萼宽度,花瓣长度、花瓣宽度,标签为鸢尾花的分类,0,1,2分别代表山鸢尾(Setosa)、变色鸢尾(Versicolor)、维吉尼亚鸢尾(Virginical)

import numpy as npdata = []with open(file='iris.txt',mode='r') as f: f.readline() while True: line = f.readline() if line: data.append(line.strip().split(',')) else: breakdata = np.array(data,dtype=float)# 使用切片提取前4列数据作为特征数据X_data = data[:, :4] # 或者 X_data = data[:, :-1]# 使用切片提取最后1列数据作为标签数据y_data = data[:, -1]data.shape, X_data.shape, y_data.shape((150, 5), (150, 4), (150,))3. 查看数据特征3.1 查看首5行数据X_data[0:5], y_data[0:5](array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2]]), array([0., 0., 0., 0., 0.]))3.2 查看数据集每个特征的最大值# axis = 0指定X轴,取每列的最大值np.max(X_data, axis=0)array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每个特征的最大值,数据集的花萼长度最大值为7.9,花萼宽度最大值为4.4,花瓣长度最大值为6.9,花瓣宽度最大值为2.5

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

如果去掉轴axis参数,就是取数据集所有数据中的最大值,会综合所有列一起的最大值。

np.max(X_data)7.93.3 查看每个特征的最小值np.min(X_data, axis=0)array([4.3, 2. , 1. , 0.1])

上面的取值就是每个特征的最小值,数据集的花萼长度最小值为4.3,花萼宽度最小值为2,花瓣长度最小值为1,花瓣宽度最小值为0.1

3.4 查看特征均值np.mean(X_data, axis=0)array([5.84333333, 3.05733333, 3.758 , 1.19933333])3.5 查看特征百分位数

百分位数是统计中使用的度量,表示小于这个值的观察值样本数量占总体的百分比。

# 25%np.percentile(X_data, 0.25, axis=0)array([4.33725, 2.0745 , 1.03725, 0.1 ])# 50%np.percentile(X_data, 0.50, axis=0)array([4.3745, 2.149 , 1.0745, 0.1 ])# 75%np.percentile(X_data, 0.75, axis=0)array([4.4 , 2.2 , 1.11175, 0.1 ])3.6 查看特征数据分布波动np.std(X_data, axis=0)array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

从标准差可以看到特征花萼宽度标准差为0.43441097数据波动最小,花瓣长度标准差数据为1.75940407,数据波动最大。

3.8 查看特征样本数量X_data.shape(150, 4)

可以看到样本数量为150,每个样本4个特征

3.9 查看标签数据分布

通过np.unique分别获得唯一ID和对应的样本数量,然后通过zip、dict转换为字典。

unique, count = np.unique(y_data, return_counts=True)label_count = dict(zip(unique, count))label_count{0.0: 50, 1.0: 50, 2.0: 50}

可以看到标签是均衡的,每个分类的样本数均是50.

4. 其它常用的科学函数函数说明示例np.sum求累加np.sum((y_pred - y_data)**2)np.exp以自然常数e为底的指数函数np.exp**2np.var求方差np.var(X_data, axis=0)np.round四舍五入np.round(np.var(X_data, axis=0), decimals=2)np.square求平方np.square(X_data)np.abs求绝对值np.abs([1, -1, -7.9, 6])np.argmax求最大值的位置索引np.argmax(X_data, axis=0)np.argmin求最小值的位置索引np.argmin(X_data, axis=0)…5. 总结

以上就是numpy科学函数的简单介绍,更多api在将来的使用中再描述。

写在末尾:

博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。面向人群:AI初级学习者专栏计划:接下来会逐步发布跨入人工智能的系列博文,敬请期待Python零基础快速入门系列Python数据科学系列人工智能开发环境搭建系列机器学习系列物体检测快速入门系列自动驾驶物体检测系列…

本文链接地址:https://www.jiuchutong.com/zhishi/300866.html 转载请保留说明!

上一篇:OpenCV安装教程(全网最细,小白直接上手!!!)(opencv安装教程vs2019)

下一篇:Vue 和 React 有什么不同?(vue和react差别)

  • 华为双卡如何设置用哪张卡流量(华为双卡如何设置拨出电话)

    华为双卡如何设置用哪张卡流量(华为双卡如何设置拨出电话)

  • 6s前置摄像头一片漆黑(6s前置摄像头模糊怎么回事)

    6s前置摄像头一片漆黑(6s前置摄像头模糊怎么回事)

  • 穗康json数据格式不正确

    穗康json数据格式不正确

  • 安卓手机软件怎么传到另一个手机上(安卓手机软件怎么导入苹果手机)

    安卓手机软件怎么传到另一个手机上(安卓手机软件怎么导入苹果手机)

  • 手机屏幕打不开但是是开机状态(手机屏幕打不开黑屏怎么办)

    手机屏幕打不开但是是开机状态(手机屏幕打不开黑屏怎么办)

  • 智能提醒是什么意思(智能提醒是什么业务)

    智能提醒是什么意思(智能提醒是什么业务)

  • 腾讯会议检测到回声(腾讯会议检测到音频设备无响应)

    腾讯会议检测到回声(腾讯会议检测到音频设备无响应)

  • 苹果7耳机线怎么接线(苹果7耳机线怎么连接)

    苹果7耳机线怎么接线(苹果7耳机线怎么连接)

  • iphone8虚化背景(iphone8怎么虚化背景)

    iphone8虚化背景(iphone8怎么虚化背景)

  • itunes怎么导出照片到电脑(itunes上怎么导出照片)

    itunes怎么导出照片到电脑(itunes上怎么导出照片)

  • 大众点评匿名评价能查到本人吗(大众点评匿名评价怎么删除)

    大众点评匿名评价能查到本人吗(大众点评匿名评价怎么删除)

  • 苹果xr分辨率和苹果7p(iphone xr屏幕分辨率)

    苹果xr分辨率和苹果7p(iphone xr屏幕分辨率)

  • 拼多多月卡怎么续费(拼多多月卡怎么开通最便宜)

    拼多多月卡怎么续费(拼多多月卡怎么开通最便宜)

  • 华为matex多大屏幕

    华为matex多大屏幕

  • 微信收款码怎么更换二维码(微信收款码怎么改名字)

    微信收款码怎么更换二维码(微信收款码怎么改名字)

  • oppo a9有呼吸灯吗(oppo a9手机有没有呼吸灯)

    oppo a9有呼吸灯吗(oppo a9手机有没有呼吸灯)

  • 荣耀9x手机参数(荣耀9x手机参数配置价格)

    荣耀9x手机参数(荣耀9x手机参数配置价格)

  • 微信语音能开一晚上吗(微信语音能开一小时吗)

    微信语音能开一晚上吗(微信语音能开一小时吗)

  • 抖音极速版能拍视频吗(抖音极速版能拍视频吗怎么拍)

    抖音极速版能拍视频吗(抖音极速版能拍视频吗怎么拍)

  • 电脑花屏了怎么处理(电脑花屏了怎么弄)

    电脑花屏了怎么处理(电脑花屏了怎么弄)

  • 怎么恢复桌面天气预报(怎么恢复桌面天气)

    怎么恢复桌面天气预报(怎么恢复桌面天气)

  • 支付宝的芝麻分怎么增加(支付宝的芝麻信用有什么用)

    支付宝的芝麻分怎么增加(支付宝的芝麻信用有什么用)

  • Win10组策略怎么打开(Win10组策略怎么进)

    Win10组策略怎么打开(Win10组策略怎么进)

  • 有效的管理你的vim插件(有效的管理你的时间的重要性英文作文)

    有效的管理你的vim插件(有效的管理你的时间的重要性英文作文)

  • 电脑学习网教大家2022年最新WordPress官方微信支付接口设置傻瓜设置教程-OK源码教学(网上学电脑哪个软件好)

    电脑学习网教大家2022年最新WordPress官方微信支付接口设置傻瓜设置教程-OK源码教学(网上学电脑哪个软件好)

  • 个税抵扣申报晚好了需要跟公司申报吗?
  • 变更税务流程登记流程和资料
  • 所得税费用怎么算分录
  • 材料出入库制度
  • 税控盘锁死提示什么
  • 库存商品盘点的作用表现为
  • 没发票的费用怎么做账
  • 发票进项税额抵扣的最晚时间
  • 财务怎么算社保缴费
  • 增资导致丧失控制权
  • 股权投资公司如何找项目合作
  • 电梯折旧费如何分摊
  • 受委托加工物资双方账务处理怎么做
  • 专门从事研发的企业研发费用可以加计扣除吗
  • 出租厂房的摊销额会计分录
  • 企业收到票据背书转让给其他公司怎么做会计处理?
  • 如何从百旺开票系统中导出开票明细
  • 公司活动宣传稿怎么写
  • 关于个人所得税下列说法正确的是
  • 招商费用计入哪个明细科目
  • 工资中的公积金怎么算法
  • 发票盖错章了怎么办呢
  • 苹果电脑任务栏跑到左边去了
  • PHP:xml_get_current_line_number()的用法_XML解析器函数
  • tracert命令的用法
  • steam怎么退款申请退款要多久
  • linux不允许root登录
  • 企业所得税计税依据
  • php gd
  • 威尼斯海滩滑板场
  • php匿名函数为何不匿名
  • 增值税加计扣除比例
  • mysqljoin查询
  • spring boot整合hibernate
  • window12最新系统
  • wget下载yum
  • 代发工资的会计科目
  • 资产减值损失的大幅度变动
  • 进口货物的报关成交方式
  • 支票的法人章盖倒了了可以吗
  • 公司年底奖金怎么计算
  • 优惠券抵扣账务处理流程
  • 年金现值的公式是怎么推导出来的
  • 现金日记账本月合计怎么划线
  • 失控发票已补税及滞纳金后还有事吗
  • 工会经费按实际发放交还是以计提的
  • 一家公司一定要有一个社保吗
  • 商业折扣入账
  • centos7.2安装
  • mysql教程入门
  • 注册表修改大全
  • 下载windows vista
  • winpe安装系统教程
  • bios没有usb启动项解决方法联想
  • 如何关闭windows8的密码
  • 开启linux系统路由转发功能的语句
  • 电脑windowxp系统重装
  • win8不能正常启动
  • centos6.10内核版本
  • linux基本使用
  • vnc里面的窗口显示不完全
  • WindowsPE与WindowsRE有什么区别
  • centos6.5怎么进入图形界面
  • win7系统桌面不能新建文件夹
  • fedora update-grub
  • w10版本更新
  • linux中执行.sh文件
  • easyui footer
  • node.js ejs
  • js的异步事件循环机制
  • js 不用var
  • js数组entries
  • 手机 日常应用 单核 多核
  • zabbix 微信
  • 云南税务查询系统
  • 广西壮族自治区图书馆
  • 税务稽查项目书的填写
  • 新疆自治区国税局郑志全
  • 南通开发区地图高清版
  • 接受虚开增值税普票如何补救
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设