从杂乱数据到整齐表格
上周整理公司会议记录时,同事发来一段从网页复制的参会人名单:
张伟 | 技术部
李娜 , 市场部
王强 — 产品部
刘洋 / 运营部每个名字和部门之间的分隔符都不一样,直接粘贴进Word表格根本没法用。这时候就得靠字符串替换——打开Word的“查找和替换”功能,把 |、,、—、/ 全部替换成统一的制表符 ^t,再粘进表格里,立马规整了。
批量重命名文件的小技巧
拍了一堆产品图,文件名是“IMG_20240401_001.jpg”这种格式。要交给设计做画册,总不能还叫这名字吧?用支持正则替换的重命名工具,把 IMG_(\d+)_(\d+)\.jpg 替换成 产品图-$2.jpg,瞬间变成“产品图-001.jpg”,清爽多了。
邮件模板中的动态填充
给客户群发报价单时,总不能每封都手动改名字。写个简单的脚本,读取Excel里的客户姓名和金额,用Python的 str.format() 拼接内容:
template = "尊敬的{}先生/女士,本次报价为{}元,请查收附件。"
for name, price in data:
msg = template.format(name, price)
send_email(to=name, body=msg)十几秒搞定上百封个性化邮件,比在Outlook里一条条改省心太多。
清理PDF复制的奇怪字符
从老PDF里复制条款文字,经常带一堆乱码空格和换行。比如一句话被拆成:
本协议自双方签
字之日起生效 ,
具有同等法律效力。用文本编辑器的多行替换功能,把 \n(换行)替换成空格,再把多个连续空格替换成一个,最后删掉多余的全角空格和标点间距,文字立马能用了。
处理Excel中的异常数据
财务导出的报表里,“金额”列有些单元格前面多了个空格,导致求和总是出错。用Excel的 =TRIM(CLEAN(A1)) 函数,一键清除不可见字符。再配合 &"" 强制转文本,避免科学计数法吞掉身份证号之类的长数字。
这些场景看着零碎,但每天都在发生。会点字符串处理,不只是程序员的事,写报告、整资料、发通知,全都省一半力气。