位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 会计新手如何学会收款流程
  • 小规模纳税人缴纳增值税怎么算
  • 用库存现金支付职工医药费用69元会计人员编制的
  • 退还押金怎么做账
  • 小规模公司企业所得税交多少
  • 礼品费如何报销
  • 应付票据和应付账款有什么区别
  • 公司注销公司帐户剩的钱怎么办
  • 机动车销售发票是否需要认证
  • 机票报销需要什么单据
  • 挂靠工程支付货款会计分录怎么写?
  • 风险纳税人还能开发票吗
  • 代扣代缴附加税怎么做账
  • 借长期借款贷在建工程
  • 银行余额调节表模板
  • 印刷专票税率是几个点
  • 商品销售税金及附加科目现在改了吗
  • 企业所得税三项费用扣除
  • 简易征收销项税额咋做账
  • 工会经费的会计分录2023
  • 采购发票主要包括什么可以根据什么单据流转生成
  • 货物发出未开票
  • 总账科目和明细科目余额分析填列
  • 此次新政策对原来就是小型微利企业的纳税人有影响吗?
  • 企业分立账务处理办法
  • 税金当月计提当月缴纳
  • 合作社人工工资账务处理
  • 美团代收是什么意思
  • 月末是指
  • 原材料退库怎么做凭证
  • 收到政府部门的奖励金怎么入账
  • 公司搞活动买的车能买吗
  • 基建会计和建筑会计的区别
  • PHP:imagecolorexact()的用法_GD库图像处理函数
  • vue数据更新会触发什么生命周期
  • 季度申报残保金怎么计算
  • 在国内如何用ChatGPT
  • 工程师模式有什么用
  • 自费出版违法吗
  • 开了专票就不能享受政策
  • 教育局是一般纳税人吗
  • 小规模纳税人的增值税账务处理
  • 公司注销后如何追缴税款
  • mac安装步骤
  • 简述sql server
  • 织梦程序
  • 罚款收入算是营收收入吗
  • 当期进项加计额怎么填
  • 减值准备需要确认递延所得税资产吗
  • sql server新增数据
  • 新准则下开办费摊销
  • 建筑工程人工费包括哪些内容
  • 无票收入是怎么算的
  • 评估价值高于账面价值怎么账务处理
  • 承兑汇票的贴现利息
  • 母公司销售给控股子公司
  • 国有资本金是什么意思
  • 三证合一之前
  • 怎样计算债券利息
  • mysql停不掉
  • 苹果mac怎么清理缓存
  • 我用u盘装系统
  • cmd显示命令
  • 微软推送win10更新 蓝牙
  • ·exe病毒
  • win10变成win8怎么办
  • win7打开游戏显示已停止工作
  • Win7旗舰版电脑亮度怎么调节?
  • linux命令的含义
  • ie 无法打开
  • win10正式版声音不正常
  • javascript字符串大小写转换
  • js对象常用方法
  • jquery.Callbacks的实现详解
  • android Graphics(一):概述及基本几何图形绘制
  • jquery弹出窗口
  • bootstrap需要学多久
  • python django
  • js手势放大缩小
  • 河南省国家税务总局发票查询系统
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设