中国科学技术大学勾安琪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利高保真视觉文字图像生成方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121685750B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610176119.7,技术领域涉及:G06T11/60;该发明授权高保真视觉文字图像生成方法、系统、设备及存储介质是由勾安琪;徐林莉设计研发完成,并于2026-02-06向国家知识产权局提交的专利申请。
本高保真视觉文字图像生成方法、系统、设备及存储介质在说明书摘要公布了:本发明公开了一种高保真视觉文字图像生成方法、系统、设备及存储介质,它们是相对应的方案,方案中:基于双域字形编码机制实现空间域与频谱域特征互学习,解决文字结构紊乱问题;基于频域感知细化机制动态调制频域信号提升笔画细节精度,并通过实例级缩放系数实现文字细节与背景质量协同优化,突破现有技术文字失真、背景失稳的瓶颈。此外,本发明支持多语言精准生成,可广泛应用于广告设计、产品包装、影视海报、教学材料等商业化场景,能大幅提升创作效率、降低人工修正成本;同时,验证了跨域特征协同提升多模态生成效能的可行性,可为文字识别模型提供稀缺场景下的优质弱监督训练样本,有效填补相关数据空白,具备技术先进性与市场落地价值。
本发明授权高保真视觉文字图像生成方法、系统、设备及存储介质在权利要求书中公布了:1.一种高保真视觉文字图像生成方法,其特征在于,包括: 分别对输入的位置图像与文本描述进行编码,对应的提取出目标文本的空间布局特征与文本描述特征;通过双域字形编码机制对目标文本的字形图像进行编码:通过空间域与频谱域的双路交替信息流完成双向优化,实现字形的空间局部细节特征与频域全局结构特征互学习,获得双域字形条件特征; 结合输入的噪声图像的潜在表示、空间布局特征与双域字形条件特征,生成多尺度条件特征; 由扩散模型的下采样层,基于噪声图像的潜在表示、时间步与文本描述特征提取多尺度跳跃连接特征,并由扩散模型的瓶颈层获得初始骨干特征;在扩散模型的上采样层中引入频域感知细化机制,其针对输入骨干特征与相应尺度条件特征分别进行实例级缩放增强,针对相应尺度跳跃连接特征与增强后的条件特征,在频谱域进行自适应动态调制,并与增强后骨干特征按通道维度拼接后通过上采样层逐步处理,获得去噪后的图像潜在表示,最终解码出视觉文字生成图像;其中,输入的骨干特征基于初始骨干特征获得或者为前一上采样层的输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励