位置: 编程技术 - 正文
推荐整理分享Python科学计算之Pandas详解(python科学计算程序),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:python科学计算基础教程,python做科学计算,python科学计算与数据处理,python科学计算基础教程,python科学计数,python科学计数,python科学计数,python科学计算基础教程,内容如对您有帮助,希望把文章链接给更多的朋友!
起步
Pandas最初被作为金融数据分析工具而开发出来,因此 pandas 为时间序列分析提供了很好的支持。 Pandas 的名称来自于面板数据(panel data)和python数据分析 (data analysis) 。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。
在我看来,对于 Numpy 以及 Matplotlib ,Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy当然是另一个主要的也十分出色的科学计算库。
安装与导入
通过pip进行安装: pip install pandas
导入:
Pandas的数据类型
Pandas基于两种数据类型: series 与 dataframe 。
Series
一个series是一个一维的数据类型,其中每一个元素都有一个标签。类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。
输出:
DataFrame
一个dataframe是一个二维的表结构。Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签。你可以把它想象成一个series的字典项。
创建一个 DateFrame:
输出:
字典创建 DataFrame
输出:
将文件数据导入Pandas
数据源可以是 英国政府数据 或 美国政府数据 来获取数据源。当然, Kaggle 是另一个好用的数据源。
选择/切片
赋值
观察操作
统计
函数应用
直方图
字符处理
合并
使用 concat() 连接 pandas 对象:
join 合并:
追加
在 dataframe 数据后追加行
分组
分组常常意味着可能包含以下的几种的操作中一个或多个
依据一些标准分离数据 对组单独地应用函数 将结果合并到一个数据结构中数据透视表
时间序列
pandas 拥有既简单又强大的频率变换重新采样功能,下面的例子从 1次/秒 转换到了 1次/5分钟:
分类
作图
数据IO
总结
标签: python科学计算程序
本文链接地址:https://www.jiuchutong.com/biancheng/381395.html 转载请保留说明!友情链接: 武汉网站建设