位置: 编程技术 - 正文
推荐整理分享Python for Informatics 第11章 正则表达式(一),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!
正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
注:以下文章原文来自于Dr Charles Severance 的 《Python for Informatics》
目前为止,我们一直在通读文件,查找模式和抽取字里行间我们感兴趣的各种信息。我们一直在使用像split和find的字符串方法,以及列表和字符串的切片功能来抽取行中的部分内容。
像这样的查找和抽取任务是如此常见,所以Python拥有一个非常强大的库——正则表达式(regular expressions)来优雅地处理这些任务。我们未早一点介绍正则表达式是因为,虽然它们很强大,但是有点复杂,并且需要一些时间去适应它们的语法。
正式表达式近乎是一个用来查找和分析字符串的小型编程语言。事实上,关于正则表达式可以写一本完整的书。在这一章,我们将只涉及其基础。想要获得正则表达式的更多信息,请参阅:
在你使用正则表达式前,你必须将库文件导入到你的程序。正则表达式最简单的应用是search()函数,下面的程序将演示search函数的小应用。
我们打开mbox-short文件,循环读取每一行,并用正则表达式的search()来查找包含“From:”字符串的行,然后打印输出这些行。这个程序并未运用正则表达式的真实能力,因为我们只要简单的使用line.find()也可实现同样的结果。
当我们在查询字符串中添加特殊字符,使得我们可以更加精确的控制那些匹配字符串的行,这时候正则表达式的能力就开始显现。在正则表达式中添加那些特殊字符可以让我们用非常少的代码实现复杂的匹配和抽取。
例如,正则表达式中用插入符号^来匹配一行中的开始。我们只要在查询字符前添加一个插入符,就可将程序修改为只匹配打印以“From:"开始的行,具体代码如下:
现在,我们将只匹配以”From:“开始的行。这个简单的例子我们可以用字符串库的startswith()方法同样实现。这个例子用来告诉我们这样一个概念,包含特殊字符的正则表达式将给我们更强的控制。
注:原文给的代码是2.7版,因为我自己使用的是3.4版,所以将print line 修改为 print(line)。
相关阅读:
Python for Informatics 第章 正则表达式(一)
Python for Informatics 第章之正则表达式(二)
Python for Informatics 第章之正则表达式(四)
关于Python for Informatics 第章 正则表达式(一)的相关内容就给大家介绍这么多,后续还会持续更新,更多精彩内容敬请关注!
Python for Informatics 第章之正则表达式(二) 注:以下文章原文来自于DrCharlesSeverance的《PythonforInformatics》.1正则表达式的字符匹配我们可以用许多其它的特殊字符创建更加强大的正则表达式。最
Python for Informatics 第章之正则表达式(四) 注:以下文章原文来自于DrCharlesSeverance的《PythonforInformatics》.3组合查询和抽取如果我们想以X-字符串开头的行中找到数字,就像下面两行字符串:X-DSPA
python中PIL安装简单教程 python的PIL安装是一件很头疼的的事,如果你要在python中使用图型程序那怕只是将个图片从二进制流中存盘(例如使用Scrapy爬网存图),那么都会使用到PIL这库,
标签: Python for Informatics 第11章 正则表达式(一)
本文链接地址:https://www.jiuchutong.com/biancheng/385325.html 转载请保留说明!上一篇:编写Python爬虫抓取暴走漫画上gif图片的实例分享(如何利用python写爬虫)
下一篇:Python for Informatics 第11章之正则表达式(二)
友情链接: 武汉网站建设