位置: IT常识 - 正文

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

编辑:rootadmin
猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数

推荐整理分享猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:北京猿创源科技有限公司,猿创设计科技有限公司,猿创教育,猿创教育,猿类的作文,猿文教育科技有限公司怎么样,猿类的作文,猿类的作文,内容如对您有帮助,希望把文章链接给更多的朋友!

这是机器未来的第44篇文章

原文首发地址:https://blog.csdn.net/RobotFutures/article/details/126615267

文章目录1. 概述2. 加载数据集3. 查看数据特征3.1 查看首5行数据3.2 查看数据集每个特征的最大值3.3 查看每个特征的最小值3.4 查看特征均值3.5 查看特征百分位数3.6 查看特征数据分布波动3.8 查看特征样本数量3.9 查看标签数据分布4. 其它常用的科学函数5. 总结1. 概述

本文以鸢尾花的数据预处理为例,描述了科学计算在机器学习使用的示例。

2. 加载数据集

以鸢尾花数据集为例。 鸢尾花数据集有4个特征,1个标签,特征为sepal_length,sepal_width,petal_length,petal_width,分别为花萼长度、花萼宽度,花瓣长度、花瓣宽度,标签为鸢尾花的分类,0,1,2分别代表山鸢尾(Setosa)、变色鸢尾(Versicolor)、维吉尼亚鸢尾(Virginical)

import numpy as npdata = []with open(file='iris.txt',mode='r') as f: f.readline() while True: line = f.readline() if line: data.append(line.strip().split(',')) else: breakdata = np.array(data,dtype=float)# 使用切片提取前4列数据作为特征数据X_data = data[:, :4] # 或者 X_data = data[:, :-1]# 使用切片提取最后1列数据作为标签数据y_data = data[:, -1]data.shape, X_data.shape, y_data.shape((150, 5), (150, 4), (150,))3. 查看数据特征3.1 查看首5行数据X_data[0:5], y_data[0:5](array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2]]), array([0., 0., 0., 0., 0.]))3.2 查看数据集每个特征的最大值# axis = 0指定X轴,取每列的最大值np.max(X_data, axis=0)array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每个特征的最大值,数据集的花萼长度最大值为7.9,花萼宽度最大值为4.4,花瓣长度最大值为6.9,花瓣宽度最大值为2.5

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

如果去掉轴axis参数,就是取数据集所有数据中的最大值,会综合所有列一起的最大值。

np.max(X_data)7.93.3 查看每个特征的最小值np.min(X_data, axis=0)array([4.3, 2. , 1. , 0.1])

上面的取值就是每个特征的最小值,数据集的花萼长度最小值为4.3,花萼宽度最小值为2,花瓣长度最小值为1,花瓣宽度最小值为0.1

3.4 查看特征均值np.mean(X_data, axis=0)array([5.84333333, 3.05733333, 3.758 , 1.19933333])3.5 查看特征百分位数

百分位数是统计中使用的度量,表示小于这个值的观察值样本数量占总体的百分比。

# 25%np.percentile(X_data, 0.25, axis=0)array([4.33725, 2.0745 , 1.03725, 0.1 ])# 50%np.percentile(X_data, 0.50, axis=0)array([4.3745, 2.149 , 1.0745, 0.1 ])# 75%np.percentile(X_data, 0.75, axis=0)array([4.4 , 2.2 , 1.11175, 0.1 ])3.6 查看特征数据分布波动np.std(X_data, axis=0)array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

从标准差可以看到特征花萼宽度标准差为0.43441097数据波动最小,花瓣长度标准差数据为1.75940407,数据波动最大。

3.8 查看特征样本数量X_data.shape(150, 4)

可以看到样本数量为150,每个样本4个特征

3.9 查看标签数据分布

通过np.unique分别获得唯一ID和对应的样本数量,然后通过zip、dict转换为字典。

unique, count = np.unique(y_data, return_counts=True)label_count = dict(zip(unique, count))label_count{0.0: 50, 1.0: 50, 2.0: 50}

可以看到标签是均衡的,每个分类的样本数均是50.

4. 其它常用的科学函数函数说明示例np.sum求累加np.sum((y_pred - y_data)**2)np.exp以自然常数e为底的指数函数np.exp**2np.var求方差np.var(X_data, axis=0)np.round四舍五入np.round(np.var(X_data, axis=0), decimals=2)np.square求平方np.square(X_data)np.abs求绝对值np.abs([1, -1, -7.9, 6])np.argmax求最大值的位置索引np.argmax(X_data, axis=0)np.argmin求最小值的位置索引np.argmin(X_data, axis=0)…5. 总结

以上就是numpy科学函数的简单介绍,更多api在将来的使用中再描述。

写在末尾:

博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。面向人群:AI初级学习者专栏计划:接下来会逐步发布跨入人工智能的系列博文,敬请期待Python零基础快速入门系列Python数据科学系列人工智能开发环境搭建系列机器学习系列物体检测快速入门系列自动驾驶物体检测系列…

本文链接地址:https://www.jiuchutong.com/zhishi/300866.html 转载请保留说明!

上一篇:OpenCV安装教程(全网最细,小白直接上手!!!)(opencv安装教程vs2019)

下一篇:Vue 和 React 有什么不同?(vue和react差别)

  • 代理服务器出现问题(代理服务器的使用)(代理服务器出现问题,或者地址错误)

    代理服务器出现问题(代理服务器的使用)(代理服务器出现问题,或者地址错误)

  • iwatch密码忘了怎么办(iwatch密码忘了怎么办怎么解锁)

    iwatch密码忘了怎么办(iwatch密码忘了怎么办怎么解锁)

  • 计算机什么系统包括计算机的所有电子(计算机什么系统和什么系统统称为计算机系统)

    计算机什么系统包括计算机的所有电子(计算机什么系统和什么系统统称为计算机系统)

  • airpods戴上没有提示声(airpods戴上没有反应)

    airpods戴上没有提示声(airpods戴上没有反应)

  • 荣耀play4tpro有nfc吗(荣耀play4tpro有没有nfc功能)

    荣耀play4tpro有nfc吗(荣耀play4tpro有没有nfc功能)

  • 充电器输出5v=1000ma是什么意思(充电器输出5v=1000ma是快充吗)

    充电器输出5v=1000ma是什么意思(充电器输出5v=1000ma是快充吗)

  • 苹果8plus能无线充电吗(苹果14手机支持无线充电吗)

    苹果8plus能无线充电吗(苹果14手机支持无线充电吗)

  • 平板辐射大还是手机辐射大(平板辐射大还是电视机辐射大些)

    平板辐射大还是手机辐射大(平板辐射大还是电视机辐射大些)

  • 卸载qq重新下载会不会没有记录(卸载qq重新下载查得到登录时间吗)

    卸载qq重新下载会不会没有记录(卸载qq重新下载查得到登录时间吗)

  • 公交车可以扫码支付吗(乘车码公交二维码)

    公交车可以扫码支付吗(乘车码公交二维码)

  • 微型计算机的性能主要取决于什么的性能(微型计算机的性能主要是由什么决定)

    微型计算机的性能主要取决于什么的性能(微型计算机的性能主要是由什么决定)

  • 多媒体信息类型主要有(多媒体信息的类型和表示方法)

    多媒体信息类型主要有(多媒体信息的类型和表示方法)

  • 路由器1200m和450m区别(路由器1200m和2100m区别)

    路由器1200m和450m区别(路由器1200m和2100m区别)

  • 手机安装的软件在哪找(手机安装的软件删除了怎么找回)

    手机安装的软件在哪找(手机安装的软件删除了怎么找回)

  • 腾讯视频忘记手机号怎么解绑(腾讯视频原来手机号忘记)

    腾讯视频忘记手机号怎么解绑(腾讯视频原来手机号忘记)

  • ipadair1和air2区别(ipadair2跟air1的区别)

    ipadair1和air2区别(ipadair2跟air1的区别)

  • 苹果五怎么录屏(旧版苹果5怎么录屏)

    苹果五怎么录屏(旧版苹果5怎么录屏)

  • 为什么别人看不到我的qq动态(为什么别人看不了我的朋友圈)

    为什么别人看不到我的qq动态(为什么别人看不了我的朋友圈)

  • vc2010怎么创建c程序(VC2010怎么创建项目)

    vc2010怎么创建c程序(VC2010怎么创建项目)

  • b612可以选照片拼图吗(b612相片)

    b612可以选照片拼图吗(b612相片)

  • 华为畅享9plus有红外线遥控吗(华为畅享9plus有nfc功能吗)

    华为畅享9plus有红外线遥控吗(华为畅享9plus有nfc功能吗)

  • 如何制作视频链接(如何制作视频链接文件)

    如何制作视频链接(如何制作视频链接文件)

  • win10怎么看已安装更新(win10怎么看已安装的驱动)

    win10怎么看已安装更新(win10怎么看已安装的驱动)

  • Linux系统中查看硬件信息与运行状态的方法总结(linux系统中查看进程的命令)

    Linux系统中查看硬件信息与运行状态的方法总结(linux系统中查看进程的命令)

  • vue路由的安装和使用(vue的路由器)

    vue路由的安装和使用(vue的路由器)

  • 合伙企业转让股权如何缴税
  • 自己的医院
  • 关税完税价格怎样理解
  • 汇算清缴期间发生的计入当期损益吗
  • 扫码开票开错了怎么改
  • 月末只有进项税需要把转出未交增值税转到未交增值税
  • 建筑公司租赁费会计分录
  • 纳税调整会计处理
  • 待抵扣进项税额分录
  • 开票报税是什么意思
  • 接受实物投资纳印花税怎么缴纳?
  • 个体户国税异常怎么办
  • 主营业务税金及附加包括什么
  • 少缴纳个人所得税的需要付什么责任
  • 缴纳了土地增值税怎么退
  • 经济补偿金如何计税
  • 税控盘全额抵扣怎么做账
  • 营运资金的范畴包括哪些
  • 6%的增值税发票能抵扣13%的吗
  • 广告机计入什么费用
  • 分摊的水费应取得何种扣除凭证
  • 给客户的回扣做账时怎么写情况说明
  • 个体户注销麻烦还是公司注销麻烦
  • win10 20h2更新时间久
  • 购货方销售退回怎么做账
  • 住房补贴缴纳比例是多少
  • 行政事业单位捐款支出怎么记账
  • Yii2中简单的场景使用介绍
  • thinkPHP5 tablib标签库自定义方法详解
  • php单例模式连接数据库
  • 基于web的疫情防控方案
  • vue2-elm
  • phpcms程序
  • 购买二手设备
  • java中同步有两种方法
  • 如何查询金税盘发票金额及开票数量
  • 其他应收款如何处理
  • db2 insert timestamp
  • sql删除表中的某一行
  • 知道收入不知道成本
  • 往酒吧送酒怎么样
  • 应收账款在贷方为负数表示什么
  • 车间消耗品的会计分录
  • 会计已入账是什么意思
  • 辅助生产车间的制造费用不通过制造费用核算
  • 钱汇错了报警有用吗
  • 怎么冲减多计提的增值税
  • 建筑发票可以一次性抵扣吗
  • 结构性存款怎么计算收益
  • 代扣代缴增值税税率
  • 过节费可以发现金吗
  • 广告制作费属于现代服务吗
  • sql server in()
  • sql 查询优化
  • linux深入理解
  • linux的用户
  • fedora linux安装教程
  • 启动npm服务
  • wibdows任务管理器
  • centos7光盘挂载方法
  • macza
  • macbookpro通知栏
  • vim 多窗口启动以及相互切换
  • 如何卸载centos7
  • windows移动中心英文怎么写
  • winxp鼠标右键菜单栏怎么改
  • win7系统笔记本怎么调节电脑亮度
  • unity调整地形高度
  • opengl中文教程
  • 对qucik cocos2dx lua SocketTCP的再一次封装,导入全局实例,包含自定义事件
  • js中使用组件
  • unity游戏加密
  • 进程间的通信方
  • python批量填表
  • 深入理解Python特性 达恩·巴德尔
  • android学什么
  • 税控盘时间不对有影响吗
  • 湖南电子税务申报
  • 怎样打印护士资格证
  • 广东省税务局网络不通
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设