位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 生产型企业进项税加计扣除
  • 法人向公司账户汇款怎么做账
  • 会计账本需要装订的有哪些
  • 收据盖公章要注意哪些
  • 应付职工薪酬月末怎么结转
  • 小规模纳税人增值税优惠政策
  • 购房所需的税费种类和费用
  • 其他货币资金包括的内容有
  • 耗材如何入账
  • 企业购买劳保用品会计处理
  • 企业预付一年的房租怎么做分录
  • 公司成立后有哪些开支
  • 收到上个月的发票怎么做分录
  • 超过一年的保证金怎么交个税
  • 固定资产报废税费怎么处理
  • 医院开发票需要税号吗
  • 同程旅行酒店预订
  • 购买软件可以退款吗
  • 固定资产折旧计入成本还是费用
  • 小规模跨年发票可以入账吗
  • 可以全额抵扣的发票
  • 红字专用发票信息表编号在哪儿
  • 印花税减免税额需要做账吗
  • 生产企业成本会计科目
  • 会议展览服务费需要交印花税吗
  • 增值税账面和实际缴纳不平,怎样调整
  • 跨年度的房租发票怎么做账
  • 小规模纳税人销售自己使用过的物品
  • 卸载了驱动程序会怎么样
  • win11系统优化教程
  • 小规模纳税企业在应交增值税明细科目
  • win10任务栏怎么隐藏
  • 公司资质办理费用
  • 塞维利亚是港口吗?
  • 入固定资产含税吗
  • 脐橙产业可行性报告
  • 金融服务机构
  • mysql.php
  • unbutun系统
  • js如何随机生成字符串
  • thinkphp ide
  • python中的查找函数
  • 成本类账户期末余额在借方还是贷方
  • 工程师模式有什么用
  • 小企业会计准则没有以前年度损益调整科目
  • mac os x10.9.5
  • mongodb createindex
  • 报销的注意事项
  • 进项加计抵扣
  • 房地产企业根据什么交增值税
  • 一个简单的脚本
  • 财政补助收入的账务处理
  • 白酒行业销售赠礼方案
  • 员工食堂买菜怎么写分录
  • 医院药品进销差价会计核算
  • 购入软件的账务处理
  • 所得税后净现金流量计算
  • 挂靠公司收的税费计入什么科目?
  • 建筑业发票可以抵扣制造业进项
  • 企业注销时应收帐款如何处理
  • 房产公司销售成本怎么算
  • SQL Server的FileStream和FileTable深入剖析
  • windows2003硬盘分区
  • 64位Windows XP系统盘空间占用很大空间怎么减肥
  • macos安装pip
  • explore是什么文件
  • window10如何修改电脑名称
  • win8怎么设置桌面
  • win10系统怎么设置开机启动项
  • 每天学一个成语
  • css设置表格隔行换色
  • js cookie用法
  • 编写shell脚本,批量建立用户
  • javascript对象主要包括
  • python井字游戏
  • Android 自定义view炫酷动画
  • python和微信交互
  • javascript数据转换
  • 如何查询企业税务情况
  • 快递代缴的关税有税单吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设