济南协晨信息技术有限公司;潍坊工程职业学院蔡清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉济南协晨信息技术有限公司;潍坊工程职业学院申请的专利一种面向文书档案的隐私数据脱敏优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121659366B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610170688.0,技术领域涉及:G06F21/62;该发明授权一种面向文书档案的隐私数据脱敏优化方法及系统是由蔡清;邵昕;顾鹏;刘滨设计研发完成,并于2026-02-06向国家知识产权局提交的专利申请。
本一种面向文书档案的隐私数据脱敏优化方法及系统在说明书摘要公布了:本发明公开了一种面向文书档案的隐私数据脱敏优化方法及系统,属于自然语言处理技术领域。该方法通过构建融合文本语义逻辑与版面空间结构的语义空间异构图谱,将非结构化文书档案转化为可计算的拓扑结构;采用结合空间修正注意力与文档主题约束的抗歧义敏感实体识别方法,实现对多义敏感实体的精准定位;基于信息熵风险评估与访问权限约束生成自适应泛化指令,动态匹配差异化脱敏策略;最后,通过脱敏数据流重组机制,在保持原有版面结构与语义连贯性的前提下完成敏感信息替换与格式修复。该方案能够有效解决现有文书脱敏过程中语义歧义大、脱敏策略僵化及脱敏后版式失真等问题,提升文书档案脱敏处理的准确性、可用性与合规性。
本发明授权一种面向文书档案的隐私数据脱敏优化方法及系统在权利要求书中公布了:1.一种面向文书档案的隐私数据脱敏优化方法,其特征在于:该方法包括以下步骤: 步骤S1:语义空间异构图谱构建,构建得到包含文本块节点、语义连接边和空间邻域连接边的文档级语义空间异构图谱对象;在步骤S1中,所述语义空间异构图谱构建,具体采用空间语义双一致性约束的文书语义空间异构图谱构建方法,通过解析原始文书档案的数据流,提取文书中每一字符对象的文本编码属性和版面空间属性,包括以下步骤:字符级基础属性解析、基于空间邻近约束的字符初级聚合、引入语义连续性约束的文本块节点生成、异构关系建模和语义空间异构图谱封装; 步骤S2:抗歧义敏感实体识别,采用基于空间修正注意力与文档主题约束的抗歧义敏感实体识别方法,得到每一文本块节点对应的敏感实体索引表;在步骤S2中,所述采用基于空间修正注意力与文档主题约束的抗歧义敏感实体识别方法,将步骤S1得到的文档级语义空间异构图谱对象中的文本块节点作为基本处理单元,输入至双流神经网络模型中;并利用双流注意力机制,引入基于所述文档级语义空间异构图谱对象全局统计得到的文档主题向量,对融合后的节点特征进行二分类判定;所述双流神经网络模型,包括文本语义特征提取流和空间位置特征提取流;文本语义特征提取流用于提取文本块节点的文本语义特征向量,空间位置特征提取流用于提取对应文本块节点的空间位置嵌入向量; 步骤S3:自适应泛化指令生成,采用基于信息熵风险评估与权限约束的自适应脱敏指令生成方法,得到分级脱敏操作指令集;在步骤S3中,采用基于信息熵风险评估与权限约束的自适应脱敏指令生成方法,依据敏感实体索引表中的每一敏感实体,结合预设的隐私类别特异性权重与基于信息论公式计算的信息熵值,计算敏感实体在当前文书上下文中的综合隐私风险分值;将综合隐私风险分值与访问者的权限等级标记作为联合输入,输入至预设的规则决策树中,依据预定义的映射规则,匹配对应的泛化算子;在匹配泛化算子的基础上,生成对应的操作参数集合; 步骤S4:脱敏数据流重组,具体为解析所述分级脱敏操作指令集,定位所述文档级语义空间异构图谱对象中对应的目标文本块节点,将节点中的原始敏感实体数据替换为依据对应泛化算子生成的泛化数据,得到脱敏文书档案数据包。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人济南协晨信息技术有限公司;潍坊工程职业学院,其通讯地址为:250000 山东省济南市高新区新泺大街1166号奥盛大厦1-2412;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励