位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 所得税退税怎么办
  • 员工预支薪金怎么记账
  • 哪些科目月底需要结转
  • 公司账外现金
  • 分公司怎么做
  • 防伪税控发票
  • 建筑公司收到劳务费
  • 向公司一般户的银行借款怎么做账?
  • 租赁房屋房产税
  • 一般存款账户可以转账给个人吗
  • 增值税发票抵扣进项税什么意思
  • 净资产出资属于货币出资吗
  • 印花税金额不足多少可以不收
  • 个人保证金业务
  • 超过三个月开发票
  • 流转税税额
  • 居间费税收是多少
  • 自产产品公益性捐赠可以免征增值税吗
  • 车船使用税计缴标准
  • 农民合作社扶持政策
  • 没有权限使用网络资源,请与这台服务器的管理员联系
  • fxssvc.exe
  • codeigniter 教程
  • 将债务转为资本的,债务人应当将债权人
  • 股权转让会记分录
  • broken pipe write failed
  • 如何写php守护进程数据
  • php实现用户登录
  • 免征个人所得税33种情形
  • 小规模纳税人收入会计分录
  • json字符串转json js
  • 小规模纳税人上月发票开错了怎么办
  • 网络分割算法
  • 爱心代码图
  • js获取本机ip地址
  • golang 和 java
  • 命令行延时
  • python 微信
  • 增值税申报表中销售额
  • 微信收款怎么做会计分录
  • 现代服务增值税纳税义务发生时间
  • python 脚本编写
  • mysql数据库三种复制类型
  • 成本会计的岗位要求
  • 企业所得税成本核定
  • 小规模纳税人增值税申报表怎么填
  • 公司开发新产品的建议
  • 费用发票处理
  • 应付职工薪酬的含义
  • 实缴增值税比计提增值税少怎么做账务处理
  • 小企业营业外支出的内容
  • 修理费未收到发票怎么办
  • 老板请员工吃饭的文案
  • 购进货物用于集体福利要交增值税吗
  • 机票价格分类
  • 经营活动产生的现金流量净额越大越好吗
  • 开发成本贷方负数表示什么
  • 收到分公司负责人的礼物
  • 设置账簿的依据
  • 删除数据库重复
  • Windows8.1和Ubuntu14.04双系统卸载Ubuntu的方法
  • 怎么配置命令
  • 360误删文件恢复怎么恢复
  • Win10 Mobile Redstone版本号确定为Build 11082明年发布
  • win10输入法怎么添加美式键盘
  • gridview添加数据
  • shell脚本符号
  • python怎么用命令行
  • js获取对象key的方式有哪些
  • 用javascript
  • 骞怎么读什么意思是什么
  • web前端网页设计师
  • 安卓两个app
  • jquery ajax局部加载方法详解(实现代码)
  • 外地经营预缴企业所得税
  • 86年的2020年是多少岁
  • 转租房子转租人需要签合同吗合法吗
  • 芜湖地税微机编码是什么
  • 给税务局说明怎写
  • 卡车生产企业
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设