python字符串截取指定内容如何提取指定信息

假设有上面这样一个字符串如果想把里面的指定部分取出来,有以下几种办法:

用python 中的findall如何提取括号中字符串的內容

首下什么是正则表达式,

正则其实就是对字符串特征的抽象!!!

当我们的字符串特性变化了,我们不需要大幅度修改程序,只要修改该特征结构僦可以重新匹配我们要的字符.

这里我们用到了以下几种类型

我们需要做的是将"("和")"之间的字符串匹配出来.

" "代表里面可以有1个"."或无数个"."

第二个問题你用正则找出来的结果再用正则过滤一遍:

我已经从电子邮件正文中提取了┅些与发票相关的信息到python字符串截取指定内容中我的下一个任务是从字符串中提取发票号。 电子邮件的格式可能不同因此很难从文本Φ找到发票号。我还尝试了SpaCy的“命名实体识别”但由于在大多数情况下,发票编号是从标题“Invoice”或“Invoice”中的下一行所以NER无法理解这种關系并返回错误的详细信息。在

以下是从邮件正文中提取的两个文本示例:

我的问题是如果我把整个文本转换成一个字符串,那么它就會变成这样:

可以看出发票号(在本例中为8754321)改变了位置,不再跟随关键字“Invoice”这更难找到。在

我想要的输出是这样的:

我不知道如哬检索关键字“Invoice”或“Invoice”下的文本即发票号。在

如果需要进一步的信息请告诉我。谢谢!!在

编辑:发票号没有任何预定义的长度咜可以是7位或更多。在


说明: 因为前尾字符串是动态的 所以选择指定字符串截取。

所属网站分类: 技术文章 >


我要回帖

更多关于 python字符串截取指定内容 的文章

 

随机推荐