位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 逾期未申报是什么意思
  • 废品销售是否缴纳增值税
  • 租赁负债的计量
  • 合作社免税收入需要成本吗?
  • 个人所得税生产经营所得税率
  • 现金账怎么记账图例
  • 固定资产原价的结余额
  • 通行费电子增值税怎么算
  • 电商行业平台开的发票怎么入账
  • 用于集体福利的消费税
  • 境外企业国内签订合同如何缴纳印花税?
  • 信用贷的基本准入要求
  • 企业购入物资合同模板
  • 非营利机构收到专用发票
  • 公司用现金发放工资在税法上合规吗
  • 增值税和消费税常用的公式
  • 业务招待费在企业所得税税前扣除的标准是什么?
  • 给职工买的意外险怎么做账
  • 发票第一联盖章吗
  • 增值税电子普通发票怎么下载
  • 保理利率多少可以买房
  • 退税可以分批吗
  • 全年累计申报个税怎么计算
  • 鸿蒙系统图标底色变白
  • 基于php开发
  • 账户验证因姓名验证错误导致失败
  • 大陆公司如何开离岸账户
  • 加入申请理由怎么写
  • 公司转让股权交不交增值税
  • php的mysql_query
  • 考核工资可以不发吗
  • 佛罗里达naples
  • 车船税发票丢失
  • 营业执照上住所和经营场所
  • 我的十年怎么写
  • modprobe operation not permitted
  • js基本数据类型和复杂数据类型的区别
  • 所得税预缴申报表怎么填
  • 销售费用计提分录
  • 非货币型资产交换CPA
  • 财政总预算会计的主体是
  • 社保费用如何做账,社保费会计分录如何写
  • 数据库平移
  • 购买项目用设备计入什么科目
  • 企业适用的增值税税率
  • 固定资产投资额在财务报表中怎么体现
  • 生活垃圾处理费合法吗
  • 制造费用怎么摊销到成本?
  • 以土地作价投资合伙企业是否缴纳土地增值税
  • 今年成立的公司需要申报残疾人保障金吗
  • 教材出版 技术咨询服务费
  • 一个营业执照可以开几个店铺
  • 手工账明细账怎么登记
  • JDBC探索之SQLException解析
  • ubuntu系统怎么用
  • centos7 syslog
  • ubuntu安装指南
  • ubuntu help
  • mac虚拟机安装教程win10正版
  • wdcp的/www目录大小调整或增加分区/硬盘的方法
  • ubuntu和debian哪个稳定
  • centos 安装svn
  • linux操作系统安装包
  • dgservice.exe是什么进程
  • linux中fdisk -l
  • linux执行sh文件显示不存在
  • 安装linux系统步骤图解
  • android应用程序开发的流程
  • 哈希表rehash
  • opengl光照算法
  • 谈谈jQuery Ajax用法详解
  • angularjs input
  • 怎样开启javascript功能
  • 简述javascript中的函数
  • 终于实现的图片
  • 成都税务局网上办事大厅
  • 地税局书记是什么级别
  • 亦庄地税局税务局营业大厅
  • 成品油消费税税目
  • 3%增值税专用发票成本多少钱
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设