Ctrl+C,Ctrl+V组合拳提取电话和邮箱
目前假设有这么一个需求: 你的一份文件里面有许多电话、邮箱以及其他文本内容,领导要求你从文本中把电话和邮箱提取处理整理到一个文档中,你想可不可以我只需要Ctrl + C ,Ctrl + V 就可以了呢.那么本条推文就可以帮你实现.
提取思路
- 打开文件,Ctrl + C
- 从剪贴板获取你内容
- 正则匹配,保存到一个列表里
- 把结果返回剪贴板
- 你Ctrl + V 到一个新文档,美滋滋的完成,Bingo
匹配电话
1
2
3
4
5
6
7
8
9# 提取固话即分机号码的正则
phoneRegex = re.compile(r'''(
(\d{3}|\(\d{3}\))? # 匹配区号,'?'表示区号可有可无
(\s|-|\.)? # 分隔符 ,号码数字之间的分隔符 比如 020-333-3333,'?'表示分隔符可有可无
(\d{3}) # 号码中前面三个数字
(\s|-|\.) # 分隔符
(\d{4}) # 最后的4个数字
(\s*(ext|x|ext.)\s*(\d{2,5}))? # 获取分机号码
)''', re.VERBOSE) # re.VERBOSE 表示可以在正则表达式中写注释,正则中注释也是以'#'开头
匹配邮箱
1 | # 提取邮箱的正则 |
获取剪贴板信息
1 | text = str(pyperclip.paste()) # 获取剪贴板的信息存到变量text中 |
处理过程
1 | matches = [] # 匹配成功的邮箱和电话存放到matches列表中 |
到这里,可以Ctrl + V了
到了这里,CV组合实现提取电话和邮箱了。需要完整的代码关注我的公众号Python孙行者,聊天界面回复”CV”,即可获取.