所有AI工具AI学习网站AI开源项目AI编程工具

LLM4Decompile开源项目 – 用大语言模型反编译二进制代码

LLM4Decompile是致力于反编译的开创性开源大型语言模型,支持将Linux x86_64二进制文件反编译为人类可读的C源代码。该项目通过利用大语言模型,提高了反编译的准确性和效率,涵盖...

标签:

AI交流(进群备注:LLM4Decompile)

LLM4Decompile是致力于反编译的开创性开源大型语言模型,支持将Linux x86_64二进制文件反编译为人类可读的C源代码。该项目通过利用大语言模型,提高了反编译的准确性和效率,涵盖了多个优化级别,并提供了丰富的基准测试和训练数据集。

LLM4Decompile的特点:

  • 1. 支持Linux x86_64二进制文件反编译
  • 2. 覆盖GCC的O0到O3优化级别
  • 3. 在40亿个C源代码和相应的汇编代码上进行了预训练
  • 4. 模型大小从1B到33B,满足不同需求
  • 5. 引入HumanEval-Decompile基准测试评估反编译代码的可重新执行性
  • 6. 提供100k训练样本的子集以支持模型训练
  • 7. 可以在单个A100 GPU上完成训练

LLM4Decompile的功能:

  • 1. 将二进制文件作为输入,生成可读的C源代码
  • 2. 进行安全分析以检测潜在漏洞
  • 3. 学习和研究编程语言和编译器优化技术
  • 4. 用于对二进制代码进行逆向工程
  • 5. 帮助开发者理解已有的二进制代码
  • 6. 扩展工具功能以支持更广泛的架构和配置

相关导航

暂无评论

暂无评论...