复旦大学徐长盛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉复旦大学申请的专利一种基于大语言模型的钢铁生产设备故障诊断系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119917965B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411795963.5,技术领域涉及:G06F18/2433;该发明授权一种基于大语言模型的钢铁生产设备故障诊断系统是由徐长盛;霍思捷;周水庚设计研发完成,并于2024-12-09向国家知识产权局提交的专利申请。
本一种基于大语言模型的钢铁生产设备故障诊断系统在说明书摘要公布了:本发明属于钢铁生产设备故障诊断技术领域,具体为一种基于大语言模型的钢铁生产设备故障诊断系统。本发明系统包括数据处理模块、大语言模型训练模块、检索增强生成模块;通过对领域数据的处理和模型训练,构建专用于钢铁生产设备的智能诊断平台;数据处理模块负责对采样数据进行特征提取并构建向量数据库,确保模型能够进行高效的语义匹配;训练模块对大语言模型进行领域适应性调整,提升其在特定领域的推理能力;检索增强生成模块通过集成向量数据库和生成式回答的方式,实现针对性强、精确度高的故障分析与技术指导;系统运行在本地或私有化服务器上进行,确保所有数据处理、模型计算和生成过程都在受控环境中完成,充分保护用户数据的隐私。
本发明授权一种基于大语言模型的钢铁生产设备故障诊断系统在权利要求书中公布了:1.一种基于大语言模型的钢铁生产设备故障诊断系统,其特征在于,包括适用于检索增强生成的数据处理模块、大语言模型训练模块、训练后大语言模型使用模块,即检索增强生成RAG模块;通过对领域数据的处理和模型训练,构建一个专用于钢铁生产设备的智能诊断平台;其中,数据处理模块负责对采样数据进行特征提取并构建向量数据库,确保模型能够进行高效的语义匹配;训练模块对大语言模型进行领域适应性调整,提升其在特定领域的推理能力;检索增强生成模块则通过集成向量数据库和生成式回答的方式,实现针对性强、精确度高的故障分析与技术指导;具体地: 一所述数据处理模块,具体包括: 1采集原始数据;从钢铁生产设备的故障报告、设备操作手册、维修记录多种数据源中采集原始数据; 2数据预处理;包括数据清洗、格式规范化和字段标注; 3数据向量化;对数据预处理完成后,使用大语言模型生成每条数据的高维向量表示,从而创建一个高效的向量数据库;通过大语言模型生成的语义向量能够准确表达故障相关语义信息; 4向量数据的存储与索引构建;使用AnythingLLM平台对生成的向量化数据进行存储与建立索引,以支持后续的快速相似度检索,并为提升检索效率和节省存储空间; 5进行负载均衡,以确保系统能够高效处理大规模数据; 二所述大语言模型训练模块,通过对大语言模型进行训练,以增强其对钢铁生产设备领域数据的分析和推理能力;在此过程中,具体通过低秩自适应技术实现高效的钢铁生产设备领域数据微调,确保大模型在保留通用能力的同时,更加专注于钢铁设备故障诊断的特定需求; 在训练过程中,设置适当的训练参数以确保模型能够有效收敛;所述训练参数包括学习率、批次大小、训练轮次等关键参数,并结合使用学习率调度器以适应模型的逐渐收敛,确保训练过程中模型性能稳定;训练任务主要涵盖设备故障原因分析和解决方案建议,通过多轮训练逐步优化模型的领域适应性,使其能在回答用户问题时提供结构化、逻辑清晰的分析和建议; 所述大语言模型训练模块中,对于RAG模型,目标是联合优化检索和生成两个部分,使得生成的文本尽可能接近目标文本;假设模型的输入是查询q,目标是生成正确的答案y,模型的输出是生成的答案并且从知识库中检索到一些候选文档D={d1,d2,…,dk},这些文档用于增强生成的上下文;训练时,损失函数同时考虑检索的效果和生成的效果;故RAG的损失函数为: Lretrievalq,D是检索部分的损失,通过最大化检索到的相关文档的得分来优化: Lretrievalq,D=-logPD*∣q, 其中,D*是与查询q最相关的正确文档,PD*∣q是模型给出该文档的概率,即余弦相似度;是生成部分的损失,基于交叉熵损失函数: 这里,yt是目标答案中的第t个词,是在给定查询q和检索到的文档D的条件下生成目标答案y的条件概率; 此外,为确保模型输出符合领域需求,在训练过程中采用特定模板和指令设计;在模型微调过程中,所述“采用特定模板和指令设计”是通过在训练数据中引入结构化的领域特化数据格式和明确的任务指令来实现,以确保模型能够准确识别设备故障并提供有效的解决方案;在训练准备阶段,首先为模型的输入和输出设计标准化的模板;包括,对于钢铁设备的故障诊断,输入模板包括“故障现象描述”和“故障部件定位”,输出模板包括“故障原因分析”、“推荐解决方法”和“操作步骤”;通过这种结构化的模板,确保输入输出信息清晰,便于模型学习如何提取关键内容和生成有针对性的答案; 训练完成后,对模型输出内容进行严格的质量控制,过滤掉无关或重复的内容,确保输出答案的完整性和逻辑性; 3所述检索增强生成RAG模块,在完成模型训练之后,采用检索增强生成RAG模块提升故障诊断的精度;该RAG模块集成了向量数据库和大语言模型,结合生成式提问和检索式回答的模式,为用户提供精确的故障分析与操作指导;具体地: 当用户提出设备故障问题时,系统将用户输入的故障现象转换为向量表示,并在向量数据库中进行检索,找到与问题语义相似的历史记录和故障解决方案;通过检索,能够快速定位到与用户问题相关的故障案例、解决方案以及操作指导;在检索结果的基础上,RAG模块将检索到的结果作为上下文信息传递给大语言模型,使生成的答案能够参考这些关联信息,从而生成更准确、详尽的故障诊断和操作建议。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励