昆明理工大学毛存礼获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利基于罗马化特征增强的大模型平行句对抽取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121598933B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610127106.0,技术领域涉及:G06F40/211;该发明授权基于罗马化特征增强的大模型平行句对抽取方法及装置是由毛存礼;高小飞;余正涛;宋燃;张勇丙;高盛祥设计研发完成,并于2026-01-29向国家知识产权局提交的专利申请。
本基于罗马化特征增强的大模型平行句对抽取方法及装置在说明书摘要公布了:本发明涉及基于罗马化特征增强的大模型平行句对抽取方法及装置,属自然语言处理领域。本发明包括首先进行数据预处理得到训练指令集、双语翻译指令集和平行句对抽取指令集;训练基于罗马化特征增强的大模型平行句对抽取模型:首先使用将罗马化语言特征融入大语言模型;然后通过翻译任务训练来增强中文与泰老语的对齐能力;其次进行监督微调,通过显式对齐信号优化大语言模型的目标语言对语义映射能力;最后使用平行句对抽取指令集采用多任务联合训练策略进行LoRA增量微调;构建基于罗马化特征增强的大模型平行句对抽取装置。本发明显著提升了汉泰、汉老平行句对抽取任务的性能。
本发明授权基于罗马化特征增强的大模型平行句对抽取方法及装置在权利要求书中公布了:1.基于罗马化特征增强的大模型平行句对抽取方法,其特征在于:所述方法包括: Step1、数据预处理: 使用罗马化转换工具将泰语和老挝语的文本统一转换为罗马化字符,构造出泰语-罗马化与老挝语-罗马化训练指令集; 基于开源语料库、互联网可比语料构建出英语-泰语、英语-老挝语双语翻译指令集和中文-泰语、中文-老挝语平行句对抽取指令集; Step2、训练基于罗马化特征增强的大模型平行句对抽取模型,包括: Step2.1、训练大语言模型,让其学习泰老罗马化知识并利用其共享的字符空间增强跨语言关联性; Step2.2、借助英语的大规模平行语料,通过联合训练“英语→泰语”和“英语→老挝语”翻译任务,使大语言模型隐式学习英语与泰老语言间的句法-语义映射规律,用于增强中文与泰老语的对齐能力; Step2.3、使用中文-泰语、中文-老挝语平行句对抽取指令集进行监督微调,通过显式对齐信号优化模型的目标语言对语义映射能力; Step2.4、最后使用Step1构建的训练指令集采用多任务联合训练策略进行LoRA增量微调; Step3、构建基于罗马化特征增强的大模型平行句对抽取装置:首先将Step2训练得到的基于罗马化特征增强的大模型平行句对抽取模型部署到服务器上,并提供出相应的服务接口;然后构建一个汉老泰平行句对抽取的可视化平台;最后通过调用服务器部署的模型接口获取对应的平行句对抽取结果,最终形成基于罗马化特征增强的大模型平行句对抽取装置用于进行平行句对抽取。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励