广东海洋大学周伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东海洋大学申请的专利基于机器学习的无监督文件数据智能分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121301568B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511502866.7,技术领域涉及:G06F16/35;该发明授权基于机器学习的无监督文件数据智能分类方法及系统是由周伟;林耀庭;张文欢;王国轩设计研发完成,并于2025-10-21向国家知识产权局提交的专利申请。
本基于机器学习的无监督文件数据智能分类方法及系统在说明书摘要公布了:本发明公开了一种基于机器学习的无监督文件数据智能分类方法及系统,属于机器学习领域,所述方法为:获取待分类文件数据集后进行多模态特征提取,得到融合文本、结构和语义特征的多维特征向量集合;通过动态自适应图神经网络生成文件特征图,结合自适应带宽核密度估计识别簇中心,通过密度聚类、层次树构建与剪枝生成初始分类结果;对纯度小于等于预设阈值的簇经主成分分析确定最大方差轴并沿最大方差轴二次分裂得到中间分类结果;构建分类知识图谱,并经图谱增强学习迭代更新,得到目标分类结果。因此,通过实施本发明,能够实现无监督场景下文件数据的精准、自适应分类。
本发明授权基于机器学习的无监督文件数据智能分类方法及系统在权利要求书中公布了:1.一种基于机器学习的无监督文件数据智能分类方法,其特征在于,包括: 获取待分类文件数据集,对所述待分类文件数据集进行多模态特征提取,得到包括多个多维特征向量的特征向量集合,其中,每个所述多维特征向量通过对文本特征向量、结构特征向量和语义特征向量进行拼接融合得到; 构建动态自适应图神经网络模型,将所述特征向量集合输入至所述动态自适应图神经网络模型,通过节点动态分裂与融合机制生成文件特征图,其中,所述文件特征图中每个节点表示一个文件特征簇,边权重表示簇间相似度; 通过自适应带宽核密度估计识别所述文件特征图中的密度吸引子作为初始簇中心,以所述初始簇中心为起点进行密度聚类形成初始簇集合,基于所述初始簇集合中各簇的密度分布特征计算簇间密度可达性,在满足密度单调递减约束条件下构建簇间层次关系树,并采用融合Wasserstein距离与轮廓系数的度量技术对所述簇间层次关系树进行动态剪枝,生成初始分类结果; 分别计算所述初始分类结果中每个簇的信息熵和相对熵并进行加权融合,以得到各簇的纯度评分,将纯度评分小于等于预设阈值的簇确定为待优化簇,通过主成分分析确定所述待优化簇的特征空间中的最大方差轴,以沿所述最大方差轴执行二次分裂,得到中间分类结果; 基于所述中间分类结果构建分类知识图谱,利用图谱增强学习算法对所述分类知识图谱进行迭代更新,得到目标文件分类结果; 所述利用图谱增强学习算法对所述分类知识图谱进行迭代更新,得到目标文件分类结果,具体为: 构建强化学习环境,将所述分类知识图谱的拓扑结构特征向量作为状态空间,将节点新增、节点删除、边添加、边删除及边权重调整操作定义为动作空间; 在每一轮迭代过程中,基于当前状态空间和策略梯度算法确定的当前图谱编辑序列生成策略,采用蒙特卡洛树搜索确定当前图谱编辑操作序列并执行; 根据复合奖励函数对执行后的结果计算复合奖励值,所述复合奖励函数为根据分类准确性提升度、图谱稀疏性变化量和结构一致性保持度加权融合对应的奖励函数; 根据所述复合奖励值更新所述当前图谱编辑序列生成策略,直至所述复合奖励值收敛或达到预设迭代次数时,得到目标图谱编辑序列生成策略,根据所述目标图谱编辑序列生成策略确定目标图谱编辑操作序列,以用于对所述分类知识图谱进行重构,得到所述目标文件分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东海洋大学,其通讯地址为:524088 广东省湛江市麻章区海大路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励