PII检测
PII检测
PII(Personally Identifiable Information)是指个人可识别信息,比如姓名,身份证号,手机号,邮箱地址,银行账号等。
假设有类似这样的一个文本:“根据昨天会议讨论的结果,赵晓辉先生将担任项目负责人,江燕女士担任行政助理,将来有任何相关问题,可电话或邮件方式先联系江燕女士,她的邮箱地址是JiangYan1688_admin@hotmail.com,电话号码为+(86) 21 2888 8888, 手机号码为138 8888 8888。另外通知,对于出差报销,请务必开设增值税发票,并注明公司账号信息,公司银行账号为 6225 8802 8888 8888,谢谢配合。”>
上面的文本中含有多个敏感的PII信息,有人名,电话号码,邮箱地址等,从文本中识别出这些信息有重大的意义:
- 保护个人隐私,有些对外公开的文档中需要识别出PII信息并进行脱敏处理,以此防止个人信息泄露
- 个人信息收集,从杂乱的文本中识别出个人信息用于后续的处理
输出: