天津财经大学刘婷婷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津财经大学申请的专利面向对外财经话语的智能分析及文本优化方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121543600B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610071079.X,技术领域涉及:G06F40/35;该发明授权面向对外财经话语的智能分析及文本优化方法与系统是由刘婷婷;刁衡设计研发完成,并于2026-01-20向国家知识产权局提交的专利申请。
本面向对外财经话语的智能分析及文本优化方法与系统在说明书摘要公布了:本发明提供一种面向对外财经话语的智能分析及文本优化方法与系统,属于信息技术与自然语言处理的交叉领域,包括:采集英文财经新闻语料进行预处理并入库,形成英文财经新闻数据库;训练基于机器学习的语言特征标注模型进行语言特征标注,识别英文文本的语言特征;搭建财经话语分析框架,以维度分值和语言特征千词化频次作为财经话语分析框架的分析基础;训练对外财经话语垂域大模型,基于财经话语分析框架对英文财经新闻文本进行分析并提出优化建议。本发明实现对英文财经文本的精准标注、语言特征分析与高质量文本润色,有效提升财经文本在英文母语读者中的可读性、准确性与影响力。
本发明授权面向对外财经话语的智能分析及文本优化方法与系统在权利要求书中公布了:1.一种面向对外财经话语的智能分析及文本优化方法,其特征在于,包括: S1、核心数据采集和清洗:采集国外媒体英文财经新闻语料以及国内外宣媒体英文财经新闻语料,进行预处理并入库,形成英文财经新闻数据库; S2、训练语言特征标注模型:基于机器学习方法,进行三轮模型训练,第一轮模型训练识别包含词性、简单语法和词汇立场的语言特征,第二轮模型训练识别包含复杂语法的语言特征,第三轮模型训练进行迭代改进,最终得到英文文本语言特征标注模型; S3、搭建财经话语分析框架:计算语言特征的千词化频次,通过因子分析得到若干个维度,以各维度分值及语言特征的标准化频次作为财经话语分析框架的分析基础,用于计算与待分析文本之间的欧式距离;包括: S301、使用所述语言特征标注模型对英文财经新闻数据库的英文文本进行重新标注,得到包含全部语言特征的标注结果; S302、计算全部语言特征在每条英文文本数据中的千词化频次,计算方式为:语言特征千词化频次=语言特征实际频次文本总token数*1000; S303、将所有语言特征的千词化频次导入社会科学统计软件SPSS中进行因子分析,删除载荷值低于0.35的语言特征,形成若干特征维度,每一维度下包含若干有明显共现趋势的语言特征; S304、统计同一维度下的语言特征在关键句中共现的分布情况,通过对分布情况的观察,最终确定各个维度的具体分类命名; S305、抽样形成维度命名验证数据集,将语言特征划分到对应的维度中,进行定量检验和定性评估;所述定量检验包括在维度命名验证数据集上对每个维度计算其载荷特征的方差解释率与克隆巴赫系数,并检验维度间的相关系数;随后将维度命名验证数据集按投影后的维度得分做聚类,评估维度得分在区分文本差异上的有效性;所述定性评估包括审阅每个维度对应的高载荷特征列表,并挑选其中出现的典型句子,判断这些句子是否与维度命名所暗示的语义范畴相符;若句子与命名契合,确认命名合理;若出现不匹配,则需重新调整特征归属或命名; S306、以所述语言特征的千词化频次作为标准化频次,并计算各维度分值,计算公式为:维度分值=该维度下所有正向特征千词化频次总和-该维度下所有负向特征千词化频次总和;根据各语言特征标准化频次和各维度分值形成英文财经话语评价标准,用于与待分析文本进行对比并形成分析结果; S4、训练对外财经话语垂域大模型:使用开源大模型作为基座进行微调,使其掌握步骤S1-S3中的知识,获得智能化交互的对外财经话语垂域大模型,为提升英文财经文本质量提供优化建议。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津财经大学,其通讯地址为:300000 天津市河西区珠江道25号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励