位置: IT常识 - 正文

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

编辑:rootadmin
猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数

推荐整理分享猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:北京猿创源科技有限公司,猿创设计科技有限公司,猿创教育,猿创教育,猿类的作文,猿文教育科技有限公司怎么样,猿类的作文,猿类的作文,内容如对您有帮助,希望把文章链接给更多的朋友!

这是机器未来的第44篇文章

原文首发地址:https://blog.csdn.net/RobotFutures/article/details/126615267

文章目录1. 概述2. 加载数据集3. 查看数据特征3.1 查看首5行数据3.2 查看数据集每个特征的最大值3.3 查看每个特征的最小值3.4 查看特征均值3.5 查看特征百分位数3.6 查看特征数据分布波动3.8 查看特征样本数量3.9 查看标签数据分布4. 其它常用的科学函数5. 总结1. 概述

本文以鸢尾花的数据预处理为例,描述了科学计算在机器学习使用的示例。

2. 加载数据集

以鸢尾花数据集为例。 鸢尾花数据集有4个特征,1个标签,特征为sepal_length,sepal_width,petal_length,petal_width,分别为花萼长度、花萼宽度,花瓣长度、花瓣宽度,标签为鸢尾花的分类,0,1,2分别代表山鸢尾(Setosa)、变色鸢尾(Versicolor)、维吉尼亚鸢尾(Virginical)

import numpy as npdata = []with open(file='iris.txt',mode='r') as f: f.readline() while True: line = f.readline() if line: data.append(line.strip().split(',')) else: breakdata = np.array(data,dtype=float)# 使用切片提取前4列数据作为特征数据X_data = data[:, :4] # 或者 X_data = data[:, :-1]# 使用切片提取最后1列数据作为标签数据y_data = data[:, -1]data.shape, X_data.shape, y_data.shape((150, 5), (150, 4), (150,))3. 查看数据特征3.1 查看首5行数据X_data[0:5], y_data[0:5](array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2]]), array([0., 0., 0., 0., 0.]))3.2 查看数据集每个特征的最大值# axis = 0指定X轴,取每列的最大值np.max(X_data, axis=0)array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每个特征的最大值,数据集的花萼长度最大值为7.9,花萼宽度最大值为4.4,花瓣长度最大值为6.9,花瓣宽度最大值为2.5

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

如果去掉轴axis参数,就是取数据集所有数据中的最大值,会综合所有列一起的最大值。

np.max(X_data)7.93.3 查看每个特征的最小值np.min(X_data, axis=0)array([4.3, 2. , 1. , 0.1])

上面的取值就是每个特征的最小值,数据集的花萼长度最小值为4.3,花萼宽度最小值为2,花瓣长度最小值为1,花瓣宽度最小值为0.1

3.4 查看特征均值np.mean(X_data, axis=0)array([5.84333333, 3.05733333, 3.758 , 1.19933333])3.5 查看特征百分位数

百分位数是统计中使用的度量,表示小于这个值的观察值样本数量占总体的百分比。

# 25%np.percentile(X_data, 0.25, axis=0)array([4.33725, 2.0745 , 1.03725, 0.1 ])# 50%np.percentile(X_data, 0.50, axis=0)array([4.3745, 2.149 , 1.0745, 0.1 ])# 75%np.percentile(X_data, 0.75, axis=0)array([4.4 , 2.2 , 1.11175, 0.1 ])3.6 查看特征数据分布波动np.std(X_data, axis=0)array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

从标准差可以看到特征花萼宽度标准差为0.43441097数据波动最小,花瓣长度标准差数据为1.75940407,数据波动最大。

3.8 查看特征样本数量X_data.shape(150, 4)

可以看到样本数量为150,每个样本4个特征

3.9 查看标签数据分布

通过np.unique分别获得唯一ID和对应的样本数量,然后通过zip、dict转换为字典。

unique, count = np.unique(y_data, return_counts=True)label_count = dict(zip(unique, count))label_count{0.0: 50, 1.0: 50, 2.0: 50}

可以看到标签是均衡的,每个分类的样本数均是50.

4. 其它常用的科学函数函数说明示例np.sum求累加np.sum((y_pred - y_data)**2)np.exp以自然常数e为底的指数函数np.exp**2np.var求方差np.var(X_data, axis=0)np.round四舍五入np.round(np.var(X_data, axis=0), decimals=2)np.square求平方np.square(X_data)np.abs求绝对值np.abs([1, -1, -7.9, 6])np.argmax求最大值的位置索引np.argmax(X_data, axis=0)np.argmin求最小值的位置索引np.argmin(X_data, axis=0)…5. 总结

以上就是numpy科学函数的简单介绍,更多api在将来的使用中再描述。

写在末尾:

博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。面向人群:AI初级学习者专栏计划:接下来会逐步发布跨入人工智能的系列博文,敬请期待Python零基础快速入门系列Python数据科学系列人工智能开发环境搭建系列机器学习系列物体检测快速入门系列自动驾驶物体检测系列…

本文链接地址:https://www.jiuchutong.com/zhishi/300866.html 转载请保留说明!

上一篇:OpenCV安装教程(全网最细,小白直接上手!!!)(opencv安装教程vs2019)

下一篇:Vue 和 React 有什么不同?(vue和react差别)

  • 微信怎么看走了多少步(微信怎么看走了哪里)

    微信怎么看走了多少步(微信怎么看走了哪里)

  • vivo x27彩铃怎么设置(vivo手机彩铃怎么弄)

    vivo x27彩铃怎么设置(vivo手机彩铃怎么弄)

  • 抖音集卡任务会刷新吗(抖音集卡任务会封号吗)

    抖音集卡任务会刷新吗(抖音集卡任务会封号吗)

  • 撤回上一步的快捷键(撤回上一个步奏快速使用工具)

    撤回上一步的快捷键(撤回上一个步奏快速使用工具)

  • line out接口什么意思(line out插口)

    line out接口什么意思(line out插口)

  • 电信服务密码初始密码是多少(电信服务密码初始密码)

    电信服务密码初始密码是多少(电信服务密码初始密码)

  • 为什么看看手机就热了(为什么看看手机就睡着了)

    为什么看看手机就热了(为什么看看手机就睡着了)

  • 手机屏有条线什么问题(如果手机屏幕有一条线)

    手机屏有条线什么问题(如果手机屏幕有一条线)

  • ocsetup是什么软件(oc是什么软件)

    ocsetup是什么软件(oc是什么软件)

  • 苹果6换电池后屏幕闪烁(苹果6换电池后摄像头不能用)

    苹果6换电池后屏幕闪烁(苹果6换电池后摄像头不能用)

  • 锐龙3700u相当于酷睿哪一款(锐龙3700u相当于英特尔哪款处理器)

    锐龙3700u相当于酷睿哪一款(锐龙3700u相当于英特尔哪款处理器)

  • 宾馆订后砍五折啥意思(酒店5折砍价)

    宾馆订后砍五折啥意思(酒店5折砍价)

  • 抖音网络连接失败(抖音怎么会显示网络连接错误)

    抖音网络连接失败(抖音怎么会显示网络连接错误)

  • mate20x可以升级5G吗

    mate20x可以升级5G吗

  • 如何创建一个受限用户(如何创建一个受控文件夹)

    如何创建一个受限用户(如何创建一个受控文件夹)

  • 华为mate30pro音量键怎么调(华为mate30pro音量大小怎么调节)

    华为mate30pro音量键怎么调(华为mate30pro音量大小怎么调节)

  • 苹果11什么时候开始售卖(苹果11什么时候出来几年了)

    苹果11什么时候开始售卖(苹果11什么时候出来几年了)

  • 小米9pro如何反向快充(小米note9pro手机怎么返回)

    小米9pro如何反向快充(小米note9pro手机怎么返回)

  • wdr5600千兆版怎么区别(wdr5620千兆版设置)

    wdr5600千兆版怎么区别(wdr5620千兆版设置)

  • 华为bactl00是什么型号(bacal00是华为啥型号)

    华为bactl00是什么型号(bacal00是华为啥型号)

  • 58同城电话号码获取频繁怎么回事(天水58同城电话号码)

    58同城电话号码获取频繁怎么回事(天水58同城电话号码)

  • 花呗怎么改手机号(花呗改手机号码怎么改)

    花呗怎么改手机号(花呗改手机号码怎么改)

  • 快手里的直播歌房怎么创建(快手直播放歌)

    快手里的直播歌房怎么创建(快手直播放歌)

  • airpods1和2外观区别(airpods1 2外观区别)

    airpods1和2外观区别(airpods1 2外观区别)

  • 蓝牙耳机延迟解决办法(蓝牙耳机延迟解决软件)

    蓝牙耳机延迟解决办法(蓝牙耳机延迟解决软件)

  • win7桌面ie图标删不掉怎么办?具体方法步骤(win7ie图标删除了怎么恢复)

    win7桌面ie图标删不掉怎么办?具体方法步骤(win7ie图标删除了怎么恢复)

  • U-Net介绍(u-net优点)

    U-Net介绍(u-net优点)

  • 深入理解CSS之flex精要之 flex-basis flex-grow flex-shrink 实战讲解(css详解)

    深入理解CSS之flex精要之 flex-basis flex-grow flex-shrink 实战讲解(css详解)

  • python pydoc是什么(.dot python)

    python pydoc是什么(.dot python)

  • 企业所得税相关分录
  • 长期股权投资收回账务处理
  • 公司清算存货怎么算
  • 预付加油卡发票可以报销吗
  • 应收外币账款如何入账
  • 支付员工提成奖金怎么做会计分录?
  • 收入跨期调整是否调增值税
  • 营业以后再次装修进什么会计科目?
  • 出口退税如何开发票
  • 330税盘费是什么意思?
  • 其他应收款在资产负债表中是负数
  • 工程质保金扣除
  • 收到保险公司赔款计入什么科目
  • 出租设备的折旧计入哪个科目
  • 全额抵免的计算
  • 属于项目的一个实例
  • 公司股权变更要换营业执照吗
  • 重置ie浏览器会有什么影响
  • bios报警声是怎样的
  • cpu性能排行榜天梯图快科技
  • 喜加一平台
  • php获取信息
  • 经销商授权书是啥意思
  • PHP:curl_multi_close()的用法_cURL函数
  • 银行同业利息 水利基金
  • 投资收益怎么做不影响利润
  • 蒂内河畔圣艾蒂安小镇,法国阿尔卑斯省 (© CAVALIER Michel/hemis.fr/Alamy Stock Photo)
  • 集体土地使用权可以抵债吗
  • jquery+thinkphp实现跨域抓取数据的方法
  • 利息收入怎么做账务处理
  • 补收入账是什么意思
  • 社保清算是怎么回事
  • 注册公司行业分类有多少种
  • 还没报税就自动清卡了怎么办
  • 子公司计入长期股权投资吗
  • 党费返还怎么记账
  • linux mint 下mysql中文支持问题
  • 动态sql怎么执行
  • 企业境外投资管理
  • 应收账款可以挂存货吗
  • 税控盘和维护费440元抵减增值税吗
  • 企业所得税表利润总额是净利润吗
  • sqlserver2008默认实例
  • 定期定额征收和查账征收的区别
  • 年度亏损计提所得税吗
  • 行政单位无偿划拨资产账务处理
  • 委托代销业务的会计分录
  • 票据比例
  • 汇算清缴补交所得税的分录
  • 无法收回的款项怎么记账
  • 一般纳税人附加税
  • 企业进行长期投资的意义
  • sql server 2012 数据库bak脚本还原
  • mysql中的字符串函数
  • sql2008没有数据库
  • win2003无法启动
  • mac os怎么删除用户
  • win8启动文件夹在哪里
  • smartagt.exe - smartagt是什么进程 什么文件
  • windows系统后台不显示QQ等软件(任务栏右侧不显示QQ图标)
  • windows无法更改设置
  • fdreader.exe是什么程序
  • wrme.exe是什么
  • win8怎么把网速调到最快
  • win7怎么打开磁盘管理器
  • windows中创建的任务计划可以多久执行一次任务?
  • redhat 6.5 安装
  • javascript数据结构与算法 pdf
  • android定时器的使用
  • 详细的测试用例
  • node.js用途
  • python随机数random.choice
  • android程序代码
  • 电子税务局怎么删除办税员
  • 小规模纳税人进口环节的增值税税率
  • 票种删除需要怎么弄
  • 大走访 方案
  • 国家税务局申报系统
  • 昱铭这个公司名字怎么样
  • 所得税汇算清缴退税税务局要来查账
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设