Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供了用于模型参数高效微调的层级选择自动化低秩适应方法,涉及模型参数微调技术领域。本发明在传统LoRA的A、B低秩矩阵基础上引入上下文调制C矩阵,结合混合专家(MoE)动态路由机制,采用“低层少专家去冗余、高层多专家强调制”的分层优化...
  • 本发明公开了基于分布匹配的多标签文本数据集蒸馏方法、设备、介质,该方法首先提取原始多标签数据集的真实特征嵌入向量,并结合高斯分布与原始标签统计概率分布初始化合成数据集。随后构建度量网络,在固定合成数据的前提下,通过最大化真实与合成数据批次间...
  • 本发明涉及智能决策技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于条件流动态模型的决策迁移方法、装置、设备及介质,包括:生成源环境标准化样本数据并训练源决策策略;构建条件流动态模型预测目标环境分布;基于最优传输距离表征分布偏...
  • 本发明提供了一种用于微调预训练模型的自适应参数插值方法与系统,涉及计算机技术领域。该方法包括以下步骤:步骤S1、获取数据集并预处理;步骤S2、初始化预训练模型,得到初始预训练模型;步骤S3、基于初始预训练模型,对预处理后的数据集执行前向传播...
  • 本申请涉及端到端自动驾驶模型训练技术领域,特别涉及一种基于动态可扩展混合专家端到端自动驾驶域增量学习方法,包括以下步骤:首先,构建初始模型;初始模型包括主干网络、初始专家和路由器模块;然后,采用初始数据域对初始模型进行训练,得到初始专家模型...
  • 本发明提供了一种语义理解模型训练方法及系统,其中方法包括:通过获取预处理后的训练样本数据,利用训练样本数据对预训练语言模型执行包含对比指令微调阶段和强化学习阶段的双阶段模型训练;在对比指令微调阶段,基于引入有监督对比正则化项的混合损失函数对...
  • 本申请涉及一种智能体记忆蒸馏方法、装置、电子装置和存储介质,该智能体记忆蒸馏方法包括:通过对智能体的记忆进行多维度分析,获得记忆的重要性评分;其中,多维度分析包括:使用频率分析、信息熵评估以及记忆强度分数;对重要性评分大于预设阈值的记忆进行...
  • 本发明涉及一种基于智能体的高效联邦特征蒸馏方法,首先构建一个系统,系统包括客户端和服务器,客户端之间通过共享特征来丰富知识迁移的内容。然后,在此系统的服务器上引入一个强化学习驱动的智能体,根据服务器端的智能体动态感知训练环境,并自适应地为每...
  • 本申请涉及一种时序预测模型的训练方法、装置、设备、存储介质和程序产品。方法包括:聚合电网负荷监测、新能源发电监测、电力设备状态监测多领域的异构原始时序数据并预处理,构建电力通用时序数据集;通过对该数据集中的电力时序样本序列随机掩码预设时间点...
  • 本发明公开了一种基于提示学习的图神经网络迁移方法、装置及系统,所述方法包括:将原始业务数据整理为含节点和边的原始图,添加提示模块得到增强图;根据冻结参数的预训练图神经网络、增强图和优化后的提示模块,建立综合模型;基于综合模型进行任务预测,得...
  • 本发明公开的属于人工智能与电力系统交叉技术领域,具体为一种基于大模型学习的调节电源模型训练方法及系统,该训练方法包括具体步骤如下:S1:整合调节电源行业多源异构数据,通过格式统一、术语标准化及知识图谱构建,将碎片化知识转化为结构化语义网络,...
  • 本申请实施例公开了一种模型训练方法、装置、设备、存储介质及产品。其中方法包括:获取第一生成模型和第二生成模型,第一生成模型用于通过第一类型图像生成第二类型图像,第二生成模型与第一生成模型作用相反,通过第一生成模型和第二生成模型,生成与样本图...
  • 本发明涉及智能决策技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于离线强化学习的决策方法、装置、设备及介质,包括:获取基础模型并基于领域知识进行调整,构建离线数据集并利用离线强化学习训练决策策略,将训练后的决策策略集成至智能...
  • 本发明公开了基于多轮FDIA路径生成的离线强化学习方法,属于电力系统信息安全与部分可观测离线强化学习交叉技术领域,该方法包括以下步骤:S1、离线数据集采集与功能模块初始化;S2、真实转移样本生成;S3、虚拟转移样本生成;S4、混合数据集训练...
  • 本申请实施例提供一种储能系统的模型训练方法、调度方法、设备、介质及程序产品,涉及储能技术。该方法包括:构建储能系统的动态环境模型,动态环境模型的状态空间至少包括电力市场实时状态和储能系统内部状态;通过跨时间尺度的权重分配,对一个预设因子集合...
  • 本申请提供了一种网络训练方法、装置、电子设备及计算机可读存储介质;方法包括:调用预设的动作网络,对智能设备在多个时间帧的状态数据和每一时间帧对应的历史动作数据进行编码,得到第一向量;确定每一时间帧对应的距离序列,并对多个时间帧对应的距离序列...
  • 本发明公开了基于多层约束与自适应学习的智能体灵活OODA决策方法和电子设备,属于人工智能与应急指挥决策领域。方法包括:将当前任务阶段映射为标准化状态机实例,对动作全集进行合法性裁剪,得到允许动作清单;利用时序逻辑红线机制在线过滤不安全动作,...
  • 本申请涉及一种歌曲信息审核模型的训练方法和歌曲信息审核方法,涉及文本审核技术领域。该方法包括:获取样本数据;样本数据包括样本歌曲信息和样本歌曲信息的样本审核结果;样本审核结果包括多个预设维度的审核结果;通过基准大语言模型对样本歌曲信息进行审...
  • 本发明公开一种基于元学习的快速模型自适应优化方法,属于人工智能模型优化技术领域,旨在解决传统微调数据成本高、元学习算法适配慢的问题。该方法包括元训练与元推理双阶段:元训练阶段构建含≥3个异质模态任务的任务池,基于交叉熵损失通过Softmax...
  • 本申请涉及人工智能与自动驾驶技术领域,特别涉及一种基于特征对比学习的自动驾驶混合专家多任务学习方法,包括以下步骤:首先,构建多任务混合专家架构,并获取训练数据集;多任务混合专家架构包括特征编码器、多任务专家组和任务路由器;然后,基于驾驶任务...
技术分类