Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 平安银行股份有限公司瞿学新获国家专利权

平安银行股份有限公司瞿学新获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉平安银行股份有限公司申请的专利一种基于Word2Vec和TFIDF的WIKI知识库搜索词分析方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115080719B

龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210736450.1,技术领域涉及:G06F16/332;该发明授权一种基于Word2Vec和TFIDF的WIKI知识库搜索词分析方法和装置是由瞿学新;翟文博;陈涛设计研发完成,并于2022-06-27向国家知识产权局提交的专利申请。

一种基于Word2Vec和TFIDF的WIKI知识库搜索词分析方法和装置在说明书摘要公布了:本申请提供一种基于Word2Vec和TFIDF的WIKI知识库搜索词分析方法和装置,属于人工智能技术领域,本申请的方法,采用Word2Vec对知识库中的文本构建语义模型,并结合改进的TF‑IDF提取搜索关键词,首先,对每个用户的搜索文本过滤无用记录,并进行分词和过滤停用词,其次,通过Word2Vec对知识库中的文本构建语义模型,得到搜索词之间的相似性,最后,根据改进的TF‑IDF方法计算得到关键词,能够有效的从用户的搜索词中得到关键词,从而了解搜索动向,以及从中发现知识的缺失,便于知识库的管理。

本发明授权一种基于Word2Vec和TFIDF的WIKI知识库搜索词分析方法和装置在权利要求书中公布了:1.一种基于Word2Vec和TFIDF的WIKI知识库搜索词分析方法,其特征在于,所述WIKI知识库搜索词分析方法包括: 对每个用户的搜索文本进行过滤处理,并通过分词和停用词过滤得到预处理搜索文本集; 采用Word2Vec构建知识库语义模型,并采用余弦相似度算法计算搜索词之间的相似度,得到相似度矩阵; 采用改进的TF-IDF方法,从搜索词中提取关键词,得到关键词权重,所述TF-IDF方法用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度; 根据所述关键词权重,采用词云的方式在前端展示对应的搜索关键词; 其中,对每个用户的搜索文本进行过滤处理,并通过分词和停用词过滤得到预处理搜索文本集包括: 在搜索数据中,将中文搜索文本转化为对应的拼音文本,得到第一搜索数据集; 在所述第一搜索数据集中,按照搜索时间升序排序,针对每个用户的搜索数据满足预设规则的视为同一次输入并进行合并,得到第二搜索数据集,所述预设规则为:,其中,、分别为不同阈值; 针对所述第二搜索数据集中同次输入的内容进行过滤,保留时间上最靠近当前时间节点的最后一条数据,得到过滤后的第三数据集; 对所述第三数据集中原先为中文的数据进行还原,并通过分词和停用词过滤得到预处理搜索文本集; 其中,所述采用改进的TF-IDF方法,从搜索词中提取关键词,得到关键词权重包括: 对预处理搜索文本集中各搜索词进行去重处理后得到搜索词集,并根据改进的TF-IDF方法,计算各搜索词的词权重,搜索词i的词权重计算公式为: 其中,γ∈0,1]为惩罚系数,ε∈0,1]为相似度阈值,countT为统计预处理搜索文本集中总词数,N为预处理搜索文本集中用户总数,为搜索包含词i的用户数,为词j与i的相似度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安银行股份有限公司,其通讯地址为:518000 广东省深圳市罗湖区深南东路5047号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。