山东大学胡鹏飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利面向嵌入式设备的基于Mamba的二进制函数识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121597274B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610128742.5,技术领域涉及:G06F8/75;该发明授权面向嵌入式设备的基于Mamba的二进制函数识别方法是由胡鹏飞;宋曙光;周逢玺;孙舒欣;秦笑娇;柳涵;刘健中;杨振设计研发完成,并于2026-01-30向国家知识产权局提交的专利申请。
本面向嵌入式设备的基于Mamba的二进制函数识别方法在说明书摘要公布了:本申请属于二进制代码分析领域,具体涉及一种面向嵌入式设备的基于Mamba的二进制函数识别方法,对固体二进制进行反汇编与细粒度标记化;利用海量无标注固体指令序列对Mamba模型进行预训练,获得预训练后的通用模型;利用带函数边界标注信息的新数据集对通用模型进行微调,从而判断是否为二进制函数的边界。本发明的关键改进在于,采用具有线性计算复杂度的Mamba架构替代传统Transformer,在保证识别准确率的同时,显著提升了处理长指令序列的速度并降低了内存开销,从而使得对海量嵌入式固体进行自动化、实时的安全审计与漏洞分析成为可能。
本发明授权面向嵌入式设备的基于Mamba的二进制函数识别方法在权利要求书中公布了:1.一种面向嵌入式设备的基于Mamba的二进制函数识别方法,其特征在于,包括: S1、指令序列规范化:获取嵌入式设备固件的二进制程序,通过反汇编工具得到其汇编指令序列,对指令进行细粒度标记化处理,生成由操作码、寄存器、立即数标记构成的序列;并使用预定义的特殊标记替换所述序列中的字符串和常量数值; S2、掩码自编码器模型预训练:掩码自编码器包括编码器和解码器;编码器利用从海量无标注嵌入式固体中提取的汇编指令序列对模型进行自监督预训练,通过最小化掩码标记的重构损失,输出对应的潜在语义表征;解码器输入为编码器输出的可见标记表征与掩码标记,重构被掩码的原始标记; 编码器包括4个堆叠的单向Mamba模块;解码器包括2个单向堆叠的Mamba模块;Mamba模块前向传播的计算流程为,对于第t-1个Mamba模块输出的序列长度为L的输入标记序列,依次进行归一化处理,经过线性投影生成中间向量x和门控向量z,对x进行因果一维卷积得到,基于计算Mamba的状态空间模型SSMs的参数,B和C,使用参数对状态空间模型SSMs的参数A和B进行离散化处理,使用SSMs计算中间输出y,将中间输出y与门控向量z进行门控操作后,与输入进行残差连接,最终输出第t个Mamba模块的标记序列; Mamba引入了选择机制,使掩码自编码器模型能够动态地从上下文中选择相关信息,通过将其状态空间模型SSMs的参数、和转换为输入的函数来实现自适应,具体为:SSMs构建为线性常微分方程,通过中间潜在状态将输入序列映射到输出序列: ; ; 其中,为状态演化参数,和分别为输入和输出投影参数,N为维度; 离散化: ; ; 其中,和为离散化参数,表示离散化步长; SSMs转换为如下卷积形式: ; ; 其中表示为输入序列的长度,表示卷积操作,为结构化卷积核,为中间输出; S3、函数识别微调:将预训练完成的掩码自编码器的解码器替换为分类器,利用带有函数边界标签的标注数据对模型进行有监督微调得到能够判断汇编指令是否为函数边界的专用模型; S4、边界预测:将待识别的剥离的嵌入式固体二进制文件经步骤S1处理后,输入微调后的模型,由所述分类器输出函数边界预测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:266200 山东省青岛市即墨区滨海路72号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励