深圳市森歌数据技术有限公司周皓然获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市森歌数据技术有限公司申请的专利一种图文引导的多模态特征驱动三维模型生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121600194B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610124592.0,技术领域涉及:G06T17/00;该发明授权一种图文引导的多模态特征驱动三维模型生成方法是由周皓然;叶绍泽;黎治华;陆国锋;陈康;袁杰遵;张举冠设计研发完成,并于2026-01-29向国家知识产权局提交的专利申请。
本一种图文引导的多模态特征驱动三维模型生成方法在说明书摘要公布了:本发明公开了一种图文引导的多模态特征驱动三维模型生成方法,属于图像数据处理技术领域,包括构造数据集;预训练图像编码模型;预训练潜在扩散模型;构造包括图像编码模型、潜在扩散模型、反投影层和合并层的三维生成模型;获取待建模物体的多视角RGB图像或文本提示,经三维生成模型生成待建模物体三维高斯集合。本发明引入12通道的属性图,提出属性图、扩散模型与三维高斯泼溅相结合的生成方法,极大提升了三维重建与渲染的质量和应用价值,为虚拟现实、数字孪生与智能制造提供了一种创新的解决方案。通过解决现有技术在一致性与效率上的问题,为高精度三维建模提供了新的技术路径,特别在工业检测与沉浸式交互中具有广泛的应用前景。
本发明授权一种图文引导的多模态特征驱动三维模型生成方法在权利要求书中公布了:1.一种图文引导的多模态特征驱动三维模型生成方法,其特征在于,包括以下步骤: S1,构造数据集D; S11,获取N个三维模型,其中第n个标记为Mn,预设属性图形状为12×H×W,其中12、H、W分别为属性通道数、图的高和宽,12通道分为颜色3通道、不透明度1通道、椭球主轴3通道、旋转四元数4通道、深度1通道; S12,对Mn,预设Vin个视角,渲染视角v的RGB图、表面法线图、世界坐标图,拼接为9通道张量,,再渲染视角v的属性图,得到Mn的输入和标签; S13,获取Mn的文本提示并编码为文本向量Cn,将Xn,Yn,Cn作为数据集D中第n个样本,依次处理每个三维模型,得到数据集; S2,构造一图像编码网络,并以为输入、为标签训练图像编码网络,得到图像编码模型; S3,预训练一潜在扩散模型,包括S31~S33; S31,构造一潜在扩散模型,包括VAE和条件扩散模型,所述VAE包括VAE编码器和VAE解码器; S32,训练VAE,所述VAE编码器将属性图编码到潜在空间,得到原始潜码z0,所述VAE解码器用于将z0解码回像素空间,得到预测属性图; S33,在潜在空间训练条件扩散模型,训练时将z0作为数据输入,Cn作为条件输入,通过正向加噪过程和反向去噪过程,输出预测潜码; S4,构造一三维生成模型,包括图像编码模型、潜在扩散模型、反投影层和合并层,所述反投影层用于将各像素反投影到三维空间,生成各像素对应的高斯原语,并将视角v的所有高斯原语构成高斯集合,所述合并层用于将Vin视角的所有高斯集合合并为Mn的三维高斯集合Gn; S5,获取待建模物体的多视角RGB图像或文本提示,经三维生成模型生成待建模物体三维高斯集合Gmd; 所述图像编码网络包括嵌入层、L层堆叠的改进Transformer层和解码层,其中第l层改进Transformer层标记为TFl,1≤l≤L; 所述嵌入层为ViT的嵌入层,用于输入,生成初始向量序列; 所述TFl包括前置归一化层、多头注意力层,相加层、四个多感知机MLP1~MLP4和相乘层; TFl-1的输出特征依次经前置归一化层、多头注意力层后得到注意力特征;和经相加层逐元素相加得到相加特征,再经MLP1得到第一MLP特征;分为两路,一路经MLP2和GELU层输出第二MLP特征,一路经MLP3得到第三MLP特征;和经相加层逐元素相加,再经MLP4得到TFl的输出特征; 所述解码层用于将中每个元素映射到12维特征,再通过形状调整和拼接,输出第一预测属性图; 训练时,最小化与的L1损失或L2损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市森歌数据技术有限公司,其通讯地址为:518001 广东省深圳市罗湖区东晓街道东晓社区太白路3008号悦彩城(北地块)写字楼1302;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励