北京神州数码云计算有限公司仉佃星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京神州数码云计算有限公司申请的专利一种模型调用请求的路由方法、装置、设备、存储介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121478455B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610031495.7,技术领域涉及:G06F9/48;该发明授权一种模型调用请求的路由方法、装置、设备、存储介质及产品是由仉佃星;李刚;李盛;杨柳春;黄天蛟设计研发完成,并于2026-01-12向国家知识产权局提交的专利申请。
本一种模型调用请求的路由方法、装置、设备、存储介质及产品在说明书摘要公布了:本申请公开了一种模型调用请求的路由方法、装置、设备、存储介质及产品,涉及计算机技术领域,该方法包括:获取模型调用请求的请求文本;计算所述请求文本的请求向量与各个任务域的嵌入向量的相似度,将相似度最高的任务域确定为目标任务域;如果所述请求向量与所述目标任务域的嵌入向量的相似度小于相似度阈值,确定所述目标任务域中各个候选模型的融合质量分数,基于各个候选模型的融合质量分数、成本分数和延迟分数,确定各个候选模型的效用值;将所述效用值最高的候选模型确定为目标模型;将所述模型调用请求路由到所述目标模型。该方法能够提高模型调用请求路由的准确率。
本发明授权一种模型调用请求的路由方法、装置、设备、存储介质及产品在权利要求书中公布了:1.一种模型调用请求的路由方法,其特征在于,所述方法包括: 获取模型调用请求的请求文本; 计算所述请求文本的请求向量与各个任务域的嵌入向量的相似度,将相似度最高的任务域确定为目标任务域; 如果所述请求向量与所述目标任务域的嵌入向量的相似度小于相似度阈值,确定所述目标任务域中各个候选模型的融合质量分数,融合质量分数包括基于项目反应理论的模型能力与请求难度匹配度、反映模型近期综合表现的ELO动态评分、以及根据请求特征实时预测的性能得分,融合质量分数的表达式为: 其中,表示模型对于请求的融合质量分数,表示基于项目反应理论的质量得分,表示模型的ELO动态评分,表示基于机器学习模型实时预测的质量得分,表示第一权重系数,表示第二权重系数,表示第三权重系数; 获取所述模型调用请求的延迟偏差、质量偏差、剩余预算以及端点评价瞬时负载; 根据延迟偏差、质量偏差、剩余预算以及端点评价瞬时负载,确定自适应权重; 基于各个候选模型的融合质量分数、成本分数和延迟分数,结合自适应权重,确定各个候选模型的效用值; 所述根据延迟偏差、质量偏差、剩余预算以及端点评价瞬时负载,确定自适应权重,包括: 根据延迟偏差、质量偏差、剩余预算,得到基础权重;对基础权重进行归一化处理;根据端点评价瞬时负载对归一化后的基础权重进行针对性修正,如果端点评价瞬时负载高负载阈值: 其中,表示修正后的延迟权重,表示归一化后的延迟的基础权重,表示延迟权重负载修正系数,表示端点评价瞬时负载,表示高负载阈值; 如果端点评价瞬时负载低负载阈值: 其中,表示修正后的质量权重,表示归一化后的质量的基础权重,表示质量权重负载修正系数,表示低负载阈值; 对修正后的权重进行最终归一化,形成自适应权重向量; 如果所述请求向量与所述目标任务域的嵌入向量的相似度大于或等于所述相似度阈值,确定所述目标任务域中各个候选模型的单一质量分数,基于各个候选模型的单一质量分数、成本分数和延迟分数,确定各个候选模型的效用值; 将所述效用值最高的候选模型确定为目标模型; 将所述模型调用请求路由到所述目标模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京神州数码云计算有限公司,其通讯地址为:100000 北京市海淀区上地九街9号3层308号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励