杭州码全信息科技有限公司吴子健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州码全信息科技有限公司申请的专利基于三维高斯泼溅的单视图大规模户外场景三维重建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121074278B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511612454.9,技术领域涉及:G06T17/00;该发明授权基于三维高斯泼溅的单视图大规模户外场景三维重建方法是由吴子健;蒋明峰;宋滢;马汉杰;俞健设计研发完成,并于2025-11-06向国家知识产权局提交的专利申请。
本基于三维高斯泼溅的单视图大规模户外场景三维重建方法在说明书摘要公布了:本发明公开了一种基于三维高斯泼溅的单视图大规模户外场景三维重建方法,该方法通过采集伪航拍图像并构建全景多模态监督端到端的单视图三维重建模型,同时引入全景一致性监督、语义约束的深度正则化以及径向加权光度损失与高斯裁剪机制,有效克服了传统单视图三维重建在几何约束不足方面的缺陷,实现了在单幅图像输入下对大规模户外场景的高效、高保真三维建模,适用于智慧城市建设、自动驾驶仿真、虚拟现实增强现实、数字孪生等多种实际场景。
本发明授权基于三维高斯泼溅的单视图大规模户外场景三维重建方法在权利要求书中公布了:1.一种基于三维高斯泼溅的单视图大规模户外场景三维重建方法,其特征在于,包括如下步骤: 1从多个城市及复杂场景中通过采集获取高分辨率的伪航拍图像以构建数据集,通过对相机视角进行系统性设计并提取相机的内外参信息; 2构建全景多模态监督端到端的单视图三维重建模型,用于将单幅输入图像直接映射为像素对齐的三维高斯集合,集合中的每一高斯基元与像素一一对应,所述高斯基元包含了中心位置坐标、旋转矩阵、缩放向量、颜色向量、透明度在内的高斯参数; 所述单视图三维重建模型采用分层的3DU-Net结构作为主干网络,其由编码器和解码器两部分组成,编码器通过多层卷积与下采样逐步提取图像的高层语义信息,解码器则通过上采样和跳接机制恢复图像的空间细节;下采样过程中每个尺度由若干个卷积模块串联实现,每个卷积模块中包含了3D卷积层,后接批量归一化、ReLU激活函数以及最大池化层;中央较低分辨率的瓶颈层加入了注意力机制,用于捕获长程的空间相关性;上采样过程中每个尺度由若干个反卷积模块串联实现且逐层拼接相应的编码特征,每个反卷积模块中包含了3D反卷积层,后接批量归一化和ReLU激活函数;解码器的输出最后通过一个1×1卷积预测得到每个像素对应的高斯基元; 3利用所述数据集在全景一致性监督机制下对上述单视图三维重建模型进行训练;在模型训练阶段,首先基于输入图像的相机位姿构建虚拟全景相机阵列,该阵列包括前、后、左、右四个方向的视角,利用相机的内外参信息对模型预测得到的三维高斯集合进行渲染,在虚拟全景相机的不同视角下生成对应的渲染图像;然后对每一视角构建由光度一致性、LPIPS、语义感知的深度损失通过加权求和得到的全景复合损失,对所有视角的全景复合损失求平均后得到模型的总损失函数,最后根据总损失函数通过梯度下降法对模型参数不断迭代更新,直至损失函数收敛,训练完成; 所述光度一致性采用渲染图像与输入图像之间像素级加权平方误差,具体表达式如下: 其中:I表示原始输入图像,表示模型预测得到的三维高斯集合经渲染得到渲染图像,i,j表示图像中任一像素坐标,Ii,j表示原始输入图像I中坐标i,j对应的像素值,表示渲染图像中坐标i,j对应的像素值,Wi,j为坐标i,j处像素的径向权重,ri,j表示坐标i,j处像素到图像中心的径向距离,r1和r2为设定的距离阈值且r1<r2,α、β、γ为设定的权重值且α>β>γ; 所述语义感知的深度损失则首先利用语义分割模型对图像进行分割,通过掩码以区分前景和背景区域,在前景与背景交界处采用边界一致性约束机制,通过引入边缘检测或梯度约束,确保深度在过渡区域的连续性;然后通过以下表达式计算渲染图像与输入图像之间的深度损失Ldepth: 其中:ΔD2为渲染图像对应深度图与输入图像对应深度图之间的误差,a1和a2为背景和前景对应的深度损失权重系数且a1<a2,Nbg为图像中背景区域的像素数量,Nfg为图像中前景区域的像素数量,Mfused=0表示掩码后图像中值为0的像素即对于背景区域,Mfused=1表示掩码后图像中值为1的像素即对于前景区域; 所述高斯基元中还引入了一个门控系数mx,y∈[0,1],在渲染过程中将基元中的所有高斯参数均乘以该门控系数后用于渲染,同时在总损失函数中加入该门控系数的稀疏化正则项用以动态抑制冗余或低贡献度的高斯基元,具体表达式如下: 其中:Lfinal为单视图三维重建模型的总损失函数,Lreconstruction为所有视角的全景复合损失均值,mi,j为坐标i,j处像素对应的高斯基元所引入的门控系数,λ为设定的权重系数; 4将待重建的单幅图像输入到训练完成的单视图三维重建模型中,得到对应的三维高斯集合,利用该三维高斯集合以及相机的内外参信息进行渲染即得到多个视角下对应的渲染图像,从而完成三维图像重建。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州码全信息科技有限公司,其通讯地址为:311100 浙江省杭州市临平区南苑街道余之城3幢13层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励