中国传媒大学王彩虹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国传媒大学申请的专利一种面向语言类场景的智能导播方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121603615B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610121052.7,技术领域涉及:H04N5/222;该发明授权一种面向语言类场景的智能导播方法和系统是由王彩虹;宋一铭;张亚娜;金立标设计研发完成,并于2026-01-29向国家知识产权局提交的专利申请。
本一种面向语言类场景的智能导播方法和系统在说明书摘要公布了:本发明涉及一种面向语言类场景的智能导播方法和系统,属于导播技术领域,解决了现有技术中人工导播成本高昂、流程复杂的问题。方法包括:基于实时语音识别技术提取当前语句和对应的每路摄像机的音视频段;基于训练好的说话人检测模型对每个音视频段进行说话人检测得到每个音视频段的说话人检测结果;基于训练好的语义分类模型提取当前语句的语义特征;基于所述语义特征、每个音视频段的说话人检测结果和每路摄像机的镜头概述得到当前语句对应的综合特征;将当前语句之前的k个语句和当前语句对应的综合特征构成综合特征序列输入训练好的决策模型,预测得到下一个镜头的摄像机标识。实现了高效、流畅的智能镜头切换。
本发明授权一种面向语言类场景的智能导播方法和系统在权利要求书中公布了:1.一种面向语言类场景的智能导播方法,其特征在于,包括以下步骤: 基于实时语音识别技术提取当前语句和对应的每路摄像机的音视频段; 基于训练好的说话人检测模型对每个音视频段进行说话人检测得到每个音视频段的说话人检测结果; 基于训练好的语义分类模型提取当前语句的语义特征; 基于所述语义特征、每个音视频段的说话人检测结果和每路摄像机的镜头概述得到当前语句对应的综合特征; 将当前语句之前的k个语句和当前语句对应的综合特征构成综合特征序列输入训练好的决策模型,预测得到下一个镜头的摄像机标识; 所述说话人检测模型为改进的TalkNet模型; 所述改进的TalkNet模型包括残差网络; 所述残差网络包括多个残差块,每个残差块包括两个卷积层;在第二个卷积层之后添加双池化时序注意力模块;所述双池化时序注意力模块用于对输入残差网络的时空特征进行动态校准; 所述双池化时序注意力模块采用以下方式对时空特征进行动态校准: 对时空特征进行维度重排; 对重排后的时空特征的空间维度进行全局平均池化,生成通道-时间联合描述; 基于通道-时间联合描述计算通道敏感权重; 基于通道-时间联合描述和通道敏感权重计算时间敏感权重; 基于时间敏感权重对重排后的时空特征进行加权,并恢复到重排前的维度顺序,得到动态校准后的时空特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国传媒大学,其通讯地址为:100024 北京市朝阳区定福庄东街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励