位置: 编程技术 - 正文

Python计算字符宽度的方法(python计算字符串长度的程序)

编辑:rootadmin

推荐整理分享Python计算字符宽度的方法(python计算字符串长度的程序),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python中计算字符串长度的函数,python字符宽度,python计算字符长度,python中计算字符串长度的函数,python中如何计算字符串长度,python字符宽度,python求字符串长度的函数,python计算字符长度,内容如对您有帮助,希望把文章链接给更多的朋友!

本文实例讲述了Python计算字符宽度的方法。分享给大家供大家参考,具体如下:

最近在用python写一个CLI小程序,其中涉及到计算字符宽度,目标是以友好的方式将一个长字符串截取为等宽的片段。

对于unicode字符,python的len函数可以准确的计算其中所包含的字符个数,但是个数并不代表宽度,如:

因此无法简单的使用这种方式来计算宽度。

GBK decode

首先我想到GBK编码,?7F范围内的字符是一字节编码,其余是双字节编码,正好与字符的宽度大体一致,于是有了这样的投机取巧的办法(假设取8个宽度):

如代码所示,首先将unicode的字符串进行GBK编码,然后截取8个字节的宽度后尝试用GBK解码,若解码失败,则少截取一个宽度,截取7个字节后使用GBK解码。

虽然初步解决了问题,但是这样做的硬伤很明显。首先代码不优雅,以试错的方式运行;其次GBK所能表示的字符有限,对于大量GBK编码以外的字符无法支持。

East_Asian_Width

Python计算字符宽度的方法(python计算字符串长度的程序)

徘徊很久之后,偶然发现 Unicode Character Database 标准中有East_Asian_Width 属性,并有以下可能值:

其中除A不确定外,F/H/N/Na/W都能很明确的知道宽度,如果保守起见,将A视为宽度为2的话,则很容易给出单个字符的宽度:

到现在似乎已经可以满足要求了,但是实际使用中发现属性为A的字符真不少见,最典型的就是中文的双引号:

在大多数等宽字体中,中文双引号都是只占一位宽的,如果一行里有多个中文双引号,则累加的误判宽度将会使截取效果大打折扣,无疑这也不是最好的办法。

urwid的解决方案

urwid 是一个成熟的python终端UI库,它在curses的基础之上包装了类似HTML的控件用以显示文本内容,如果有这方面的开发需求,非常推荐此库,比直接使用curses库方便很多,非常棒的是它对unicode的文本宽度截取非常准确,让我大为惊讶,于是翻开它的源码一探究竟,文本宽度计算方面其核心代码如下:

如代码所示,首先根据unicode的官方EastAsianWidth 文档整理出字符宽度的范围表,然后使用unicode代码查表。使用之前的例子测试:

完全准确,而且在实际应用中的表现也比较好,是一个理想的解决方案,更多技巧请查阅urwid的old_str_util.py 源码。

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python Socket编程技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python模块包中__init__.py文件功能分析 本文实例讲述了Python模块包中__init__.py文件功能。分享给大家供大家参考,具体如下:用django做开发已经一年多的时间,但基本没注意python模块中__init__.

Python中getattr函数和hasattr函数作用详解 hasattr(object,name)作用:判断对象object是否包含名为name的特性(hasattr是通过调用getattr(ojbect,name)是否抛出异常来实现的)。示例:hasattr(list,'append')Truehasatt

浅析Python中的getattr(),setattr(),delattr(),hasattr() getattr()函数是Python自省的核心函数,具体使用大体如下:获取对象引用getattrGetattr用于返回一个对象属性,或者方法classA:def__init__(self):self.name='zhangjing'#s

标签: python计算字符串长度的程序

本文链接地址:https://www.jiuchutong.com/biancheng/387625.html 转载请保留说明!

上一篇:Python中文分词实现方法(安装pymmseg)(python中文分词库)

下一篇:Python模块包中__init__.py文件功能分析(python 包 __init__)

  • 建筑行业有哪种职业
  • 代收的水资源税收入是否计入企业所得税
  • 多余的进项税该怎么处理
  • 交车辆保险的车能买吗
  • 小规模纳税人利息收入增值税税率
  • 企业所得税的亏损怎么弥补
  • 股东归还公司借款,应该记什么科目
  • 更改开票信息需要多久
  • 什么情况下做暂估
  • 网络服务费属于什么费用
  • 2019印花税减免
  • 旧房转让土地增值税扣除项目
  • 分公司成立时的法人是谁
  • 公司注销应付款太多
  • 跨年的发票作废账务如何处理
  • 工会经费基数是上个月收到的工资还是什么
  • 劳务报酬代扣代缴个人所得税怎么做账
  • 新租赁准则承租人进项税
  • 小规模纳税人代理记账流程
  • 汉字防伪企业是哪家
  • 自有房产墙面出租,需要缴纳房产税吗?
  • 转账支票存根属于银行回单吗
  • 企业劳务外包取费的标准以及依据是什么?
  • 资金拆借利息收入是什么意思
  • 租金怎么来计算个税
  • 车辆拍卖怎么过户
  • rmb转
  • the Pura Meduwe Karang神庙中雕刻艺术家W.O.J.Nieuwenkamp的作品,印度尼西亚巴厘岛 (© John Elk III/Getty Images)
  • 电脑老是弹出广告怎么处理
  • 进程核心栈
  • 资产减值损失结转
  • 冲回暂估分录
  • 实习生究竟该怎么缴个税?
  • tepac接口
  • 乐观锁用法
  • 计提企业税费和缴纳分录怎么做
  • 口腔门诊提供免费服务有哪些?
  • 大前端2021
  • 城市维护建设税是什么意思
  • 需要计提坏账准备吗
  • 下乡扶贫有补助吗
  • 公司进行清算
  • 发票金额大于付款金额怎么做分录
  • chrome网上应用商店在哪
  • 什么是符合资本化
  • 临时贷款属于什么会计科目
  • 商品流通企业的种类
  • 车辆维修费如何赔偿
  • 增值税税控系统技术维护费怎么抵扣
  • 暂估和冲暂估分录
  • 其他应收款科目核算哪些业务
  • 补缴税款计入什么科目
  • 无形资产摊销如何操作
  • 客户试用产品期间怎么跟进
  • 固定资产清理不及时
  • 代开发票的弊端是如何体现的?
  • 应收账款的审计方式和手段
  • win10预览版怎么样
  • 苹果电脑dock栏是什么意思
  • mac的虚拟机
  • 电脑进程wsappx是什么
  • ubuntu搭建nginx服务器教程
  • manager是啥
  • window10使用ie8
  • cocos内存管理
  • jquery点击切换div
  • jq拖拽div替换位置
  • LayoutInflater.inflate方法解析
  • css div 不换行
  • nodejs lua
  • jquery选择器写法
  • 设置默认python版本
  • 安卓接口回调例子
  • 12366纳税服务热线坐席人员
  • 企业环境信用等级在哪里查询
  • 纳税人识别号不能含有IOZSV
  • 个人的社会信用代码怎么查
  • 如何挑选烟叶等级
  • 济宁地方税务局
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设