云南大学田羽凌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉云南大学申请的专利基于时间序列和话题相似度分析的社交舆情事件检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116205225B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310101856.7,技术领域涉及:G06F40/289;该发明授权基于时间序列和话题相似度分析的社交舆情事件检测方法是由田羽凌;苗圣法;姚绍文;木永康;黄越;郑鸿峰;张伟生;王若舒;吴昊洋;李文哲;马世超;周舟;曾威威;郑奕森;牟新颖设计研发完成,并于2023-02-08向国家知识产权局提交的专利申请。
本基于时间序列和话题相似度分析的社交舆情事件检测方法在说明书摘要公布了:本发明公开了一种基于时间序列和话题相似度分析的社交舆情事件检测方法,从社交网络中爬取待分析时间段内和所需分析主题相关的发布文本并进行预处理,得到各个话题的话题时间序列,然后对话题时间序列进行分割得到话题时间子序列,提取话题时间子序列的热度峰值点数量和话题时间长度对话题进行初步筛选,然后从筛选出的有效话题中获取共现话题集合,计算每个共现话题对中两个话题的峰值距离并对共现话题对进行筛选,计算保留共现话题对中两个话题的文本相似度,筛选出文本相似度大于阈值的共现话题对,根据筛选出的共现话题对生成若干图,每个图代表一个事件,从而完成社交舆情事件的检测。本发明可以更加全面准确地对社交舆情事件进行挖掘。
本发明授权基于时间序列和话题相似度分析的社交舆情事件检测方法在权利要求书中公布了:1.一种基于时间序列和话题相似度分析的社交舆情事件检测方法,其特征在于,包括以下步骤: S1:根据实际需要确定待分析的主题,然后从社交网络中爬取待分析时间段内和主题相关的发布文本,并提取各个发布文本的标签、时间戳和文本内容信息;将待分析时间段划分为N个子时间段,每个子时间段作为一个时间点,将每个标签作为一个话题,记话题总数为M;对于每个话题,根据标签和时间戳统计每个时间点上对应标签的出现次数,作为该话题在该时间点上的热度值hn,m,n=1,2,…,N,m=1,2,…,M;对于第m个话题,将热度值大于0的时间点作为有效时间点,记第m个话题的有效时间点的数量为Dm,将有效时间点按照时间顺序进行排列,得到话题时间序列tm,1,tm,2,…,tm,d,其中tm,d表示第m个话题中第d个时间点在待分析时间段内的原始序号,d=1,2,…,Dm; S2:依次判断话题时间序列tm,1,tm,2,…,tm,d中相邻2个有效时间点的时间间隔是否大于预设时间阈值,如果不大于,则不作任何操作,否则在这2个有效时间点之间插入一个分割点,根据得到的分割点将话题时间序列分割为话题时间子序列,记第m个话题所得到的话题时间子序列数量为Km,第k个话题时间子序列记为分别表示第m个话题的第k个话题时间子序列的起始时间点序号和结束时间点序号,k=1,2,…,Km; 对于每个话题时间子序列Tm,k,获取对应时间段内第m个话题的热度值序列Hm,k,搜索热度值序列Hm,k中的热度峰值点,记热度值序列Hm,k中热度峰值点的数量为Wm,k; 计算第m个话题的平均话题时间长度τm,k表示话题时间子序列Tm,k的长度,然后计算第m个话题的热度峰值点出现频率预先设置平均话题时间长度阈值TL和热度峰值点出现频率阈值TF,如果第m个话题的平均话题时间长度Lm<TL且热度峰值点出现频率Fm<TF,则将该话题作为有效话题,否则将该话题删除; S3:对于每个时间点,筛选在该时间点热度值大于0的有效话题,得到该时间点的共现话题集合αn; S4:对于每个共现话题集合αn,将其中的话题进行两两配对得到共现话题对,然后采用如下方法计算每个共现话题对中两个话题之间的峰值距离: 记共现话题对中两个话题为P1,P2,记步骤S2中话题Pi所得到的热度峰值点数量为Ri,i=1,2,记第r个热度峰值点对应的时间点序号为ti,r,r=1,2,…,Ri,得到话题Pi的峰值时间点序列然后使用DTW算法计算话题P1、P2的峰值时间点序列之间的距离作为话题P1、P2的峰值距离; 预先设置峰值距离阈值,如果共现话题对两个话题之间的峰值距离大于该峰值距离阈值,则将该共现话题对删除,否则保留该共现话题对,得到共现话题对集合Y; S5:计算共现话题对集合Y中每个共现话题对的两个话题之间的文本相似度,具体方法为: 记共现话题对中两个话题为Q1,Q2,从步骤S1所爬取的所有发布文本中筛选出话题Qi的发布文本集合βi,将发布文本集合βi中的每个发布文本采用预设操作进行预处理,将预处理后的发布文本拼接成长文本Gi;然后对长文本Gi进行词嵌入,得到长文本Gi的文本向量Si;计算文本向量S1和文本向量S2的相似度,作为话题Q1,Q2的文本相似度; S6:预先设置文本相似度阈值,如果共现话题对集合Y中共现话题对的两个话题的文本相似度小于文本相似度阈值,则将其删除,否则保留该共现话题对,得到共现话题对集合Y′;然后将共现话题对集合Y′中各个话题作为节点、共现话题对之间的文本相似度作为边的权值生成图,图中每个子图代表一个事件,从而完成社交舆情事件的检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人云南大学,其通讯地址为:650031 云南省昆明市翠湖北路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励