位置: IT常识 - 正文

数据分析| Pandas200道练习题,使用Pandas连接MySQL数据库(数据分析课)

编辑:rootadmin
数据分析| Pandas200道练习题,使用Pandas连接MySQL数据库 文章目录使用Pandas连接数据库编码环境依赖包read_sql_query()的使用read_sql_table()的使用read_sql() 函数的使用to_sql()写入数据库的操作删除操作更新操作总结:

推荐整理分享数据分析| Pandas200道练习题,使用Pandas连接MySQL数据库(数据分析课),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:数据分析师,数据分析师一般一个月多少钱,数据分析案例网站,数据分析师一般一个月多少钱,数据分析课,数据分析网站,数据分析课,数据分析课,内容如对您有帮助,希望把文章链接给更多的朋友!

使用Pandas连接数据库

通过pandas实现数据库的读,写操作时,首先需要进行数据库的连接,然后通过调用pandas所提供的数据库读写函数与方法来实现数据库的读写操作。

Pandas提供了3个函数用于数据库的读操作

read_sql_query() 可以实现对数据库的查询操作,但是不能直接读取数据库中的某个表,需要在sql语句中指定查询命令与数据表的名称read_sql_table() 只能读取数据库某一个表的内的数据,并且该函数需要sqlalchemy 模块的支持才能使用read_sql()函数,既可以读取数据库中某一个表的数据,也可以进行执行具体的查询操作。

Pandas提供了1个函数用于数据库的写操作

to_sql()该函数用户实现数据的写入操作,通过DataFrame对象直接调用,和将DataFrame对象保存为其他类型的文件类似。编码环境

Jupyter Notebook

依赖包pymysqlsqlalchemy 该模块 是在使用read_sql_table() 函数时必须要用的模块

安装包

pip install pymysqlpip install sqlalchemyread_sql_query()的使用

参数

pd.read_sql_query( sql, # 需要执行查询的sql语句 con, # 数据库的连接 index_col=None, 字符串或字符串列表,可选,默认值:无 coerce_float: 'bool' = True, 尝试将非字符串,非数字对象(如decimal.Decimal)的值转换为浮点值 params=None, parse_dates=None, chunksize: 'int | None' = None, dtype: 'DtypeArg | None' = None,)

pd.read_sql_query() 函数返回的数据类型时DataFrame

案例与使用

import pandas as pdimport pymysql # 导入操作mysql的数据包import sqlalchemy # 使用pymysql进行连接数据库db = pymysql.connect(host='127.0.0.1',user='root',passwd='123456',port=3306,charset='utf8',database='comment_v1')# user 用户名# password 密码# host 端口号# database 数据库名# charset 编码格式# 编写sql语句sql = 'select * from user_comment'# 通过read_sql_query函数进行查询sql_query_data = pd.read_sql_query(sql=sql,con=db)sql_query_data

read_sql_table()的使用

使用read_sql_table() 函数我们需要使用sqlalchemy 模块进行连接数据库,通过这个模块我们才可以对某一个表进行查询。

在使用其他的驱动程序的时候,会报NotImplementedError错误。

NotImplementedError: read_sql_table only supported for SQLAlchemy connectable.

参数

pd.read_sql_table( table_name: 'str', # 数据库名称 con, # 数据库连接 schema: 'str | None' = None, index_col: 'str | Sequence[str] | None' = None, coerce_float: 'bool' = True, parse_dates=None, columns=None, chunksize: 'int | None' = None,)数据分析| Pandas200道练习题,使用Pandas连接MySQL数据库(数据分析课)

read_sql_table() 函数返回DataFrame类型 案例与使用

# 使用sqlalchemy连接数据库,依次设置sql_query_db = sqlalchemy.create_engine("mysql+pymysql://root:123456@127.0.0.1:3306/comment_v1")# mysql+pymysql://root:123456@127.0.0.1:3306/comment_v1"# mysql 连接的数据库类型# pymysql 连接数据库的驱动# root 用户名# 123456 密码# 127.0.0.1 数据库地址# 3306端口号 # comment_v1连接的数据库名称# 通过read_sql_table table = pd.read_sql_table(table_name='user_comment',con=sql_query_db)table

read_sql() 函数的使用

read_sql()使用pymysql或者sqlalchemy对象都可以

参数

pd.read_sql( sql, # sql语句 con, # 连接对象 index_col: 'str | Sequence[str] | None' = None, coerce_float: 'bool' = True, params=None, parse_dates=None, columns=None, chunksize: 'int | None' = None,)

案例与使用

# 通过read_sql函数读取数据库的信息# 使用pymysql进行连接数据库db = pymysql.connect(host='127.0.0.1',user='root',passwd='123456',port=3306,charset='utf8',database='comment_v1')sql = 'select * from user_comment'read_sql = pd.read_sql(sql=sql,con=db)read_sql# 通过read_sql函数读取数据库的信息# 使用pymysql进行连接数据库sql_query_db = sqlalchemy.create_engine("mysql+pymysql://root:123456@127.0.0.1:3306/comment_v1")sql = 'select * from user_comment'read_sql = pd.read_sql(sql=sql,con=sql_query_db )read_sql

to_sql()写入数据库的操作

to_sql方法同样需要使用SQLAlchemy模块的支持 参数

df.to_sql( name: 'str', # 表名称 con, # 数据库连接 schema=None, if_exists: 'str' = 'fail', # fail如果表已经存在就不执行写入,replace 如果表存在就删除原来的表,再进行写入,append代表在原有数据表中添加数据 index: 'bool_t' = True, # 是否将行索引写入数据库中 index_label=None, chunksize=None, dtype: 'DtypeArg | None' = None, method=None,)

案例与使用

# 使用sqlalchemy模块进行连接sql_query_db = sqlalchemy.create_engine("mysql+pymysql://root:123456@127.0.0.1:3306/atguigudb")data = { "A":[1,2,3,4], "B":[6,7,8,9], "C":[4,3,2,1]}df = pd.DataFrame(data)df.to_sql('to_sql_dome',con=sql_query_db,if_exists='append')# 测试,查询sql = "select * from to_sql_dome"read_df = pd.read_sql(sql=sql,con=sql_query_db)read_df

结果

如和删除和更新数据库中的数据,pandas官方并没有提供相应的函数,但是我们同样可以使用read_sql和read_sql_query来进行实现对数据的删除和修改(sql语句会执行,但是程序会报错),还可以通过原生python利用哦个pymysql中的execute()方法来执行对数据的删除和修改。 在实际生产过程中并不建议这样操作,因为在实际过程中数据对公司是非常重要的,作为一个数据分析师我们并不会拿到删除和更新操作的权限,数据分析也不会修改原数据,在进行分析和建模的所拿到的数据都是复制数据库的数据。

删除操作

删除to_sql_dome 表中A = 1的一行数据

sql = "DELETE FROM to_sql_dome WHERE A = 1;"read_df = pd.read_sql(sql=sql,con=sql_query_db)

执行上面的代码以后会报错 使用pymsql和sqlalchemy两种的报错不一样

sqlalchemy:ResourceClosedError: This result object does not return rows. It has been closed automatically.pymsql:TypeError: 'NoneType' object is not iterable

更新操作sql = "update to_sql_dome set B=2 where A = 4"read_df = pd.read_sql(sql=sql,con=db)

执行后同样也会报错,使用pymsql和sqlalchemy两种的报错不一样

sqlalchemy:ResourceClosedError: This result object does not return rows. It has been closed automatically.pymsql:TypeError: 'NoneType' object is not iterable```rceClosedError: This result object does not return rows. It has been closed automatically.

最后在强调一下,pandas并不推荐使用read_sql和read_sql_query来进行实现对数据的删除和更新,如果想对数据进行操作,可以使用原生的python利用pymysql进行操作。

总结:

通过上面的四个方法我们发现Pandas操作数据库还是很方便的:

read_sql()和read_sql_query()都是通过执行sql来进行查询的操作,在查询数据时更重要的是对sql语句的掌握。read_sql_table() 是通过指定表名进行查询整个表的数据to_sql()写入数据库,可以根据if_exists三个参数的不同来控制保存的数据表是删除重新保存还是追加或者是不进行操作。

本文链接地址:https://www.jiuchutong.com/zhishi/297428.html 转载请保留说明!

上一篇:vue父子组件传值不能实时更新(vue父子组件传值方法)

下一篇:vue实现将自己网站(h5链接)分享到微信中形成小卡片(超详细)(vue引入网络js)

  • 固定资产报废收入
  • 出口关税税率表
  • 关联企业的判定标准
  • 门诊医保报销发票
  • 等线支付给劳务派遣单位的工资怎么做账
  • 建筑企业有哪些
  • 纳税收入包含哪些
  • 发票同步功能在哪里
  • 农户的竹扫把如何开票
  • 车间消耗品的会计分录
  • 存货营业外支出包括哪些
  • 报销定额备用金什么意思
  • 多层股权结构设计控制法
  • 跨月增值税专票退回涉及哪些税费
  • 购买的认证标志入什么费用?
  • 汽车修理费增值税税率
  • 中国工商银行社保查询
  • 股东的房产无偿提供给公司用
  • 防洪保安基金应用范围
  • 公司代缴的个税怎么查询
  • 公司向个人租赁房屋要缴什么税
  • 劳务派遣公司差额征税怎么申报
  • 腾讯电脑管家中蓝牙在哪
  • 报销冲销借款
  • win11系统开机密码怎么修改
  • php中substr()
  • 低值易耗品报废账务处理
  • PHP:pcntl_wtermsig()的用法_PCNTL函数
  • 橡皮树的养殖方法视频教程
  • laravel 更新数据
  • 上季度的亏损可以弥补下季度的企业所得税
  • vue created mounted
  • 借递延所得税资产贷以前年度损益调整
  • etc通行费发票可以抵扣吗
  • 公司账户转法人账户
  • RLHF:基于人类反馈(Human Feedback)对语言模型进行强化学习【Reinforcement Learning from Human Feedback】
  • ab1562a固件
  • mzip命令 控制磁盘驱动器
  • 增值税发票已经认证了,但是税票原票没给,会有什么后果
  • 增值税普通发票可以抵扣吗
  • 开负数发票的规定是有?
  • access调用sql
  • db2使用教程
  • 拍卖车牌收入需要缴纳什么税
  • 待认证进项税额月末怎么处理
  • 转增资本需要交税吗
  • 货款减免协议
  • 先开收据再打款
  • 行政性罚款有哪些
  • 预计负债 负债 区别
  • 加班就餐费如何入账
  • 资产评估费怎么收
  • 租赁办公楼
  • 存货盘亏的账务处理怎么做
  • mysql启动服务器失败
  • 怎么修改注册表的权限
  • 使用命令行 -devmode
  • linux临时目录在哪
  • 关于操作系统的叙述中
  • win8怎样关闭系统更新
  • mac win10 wifi
  • nginx文件服务器
  • win1020h2版本千万别更新
  • win7 设置
  • 关于dns的说法错误的是
  • node.js axios
  • 基于socket的聊天程序
  • css图片标签
  • js对话框确定事件
  • textview在哪
  • 杀掉进程windows
  • 使用的英文
  • 脚本控制三行三列怎么写
  • Unity3D中ScreenPointToRay函数的分析-个人见解
  • python常用操作运算符
  • JavaScript中的NaN代表什么
  • android动画实现方式
  • 市民服务热线有用吗
  • 税务局与税务所工资哪个高
  • 建筑业甲方代扣代缴增值税吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设