CVE-2012-0158:Microsoft Office MSCOMCTL.ocx 栈溢出漏洞调试分析
阅读原文时间:2021年05月19日阅读:1

0x01 Lotus Blossom 行动

  • 在 2015 年 6 月,国外安全厂商 Palo Alto Networks 的威胁情报团队 Unit42 发现了一起针对东南亚政府的一次间谍行为,试图获取该国家的内部运作信息,此次攻击行动代号为 Lotus Blossom
  • 通过恶意构造 Office 文档使目标上钩,从而在对方的计算机中植入木马,诱骗的内容包括电影邀请、明星照片、陆军机密文件、IT 升级计划等等
  • 其中就利用了著名的 CVE-2012-0158 Word 栈溢出漏洞(用烂了的),CVE-2012-0158 的成因是 MSCOMCTL 模块中对文档数据读取过滤不严导致堆栈溢出

0x02 构建漏洞分析环境

0x03 根据异常定位漏洞函数

  • 这一次并没有用到 Windbg,因为异常点并没有想要的信息;利用 Immunity Debugger 附加 Word 进程打开漏洞文档(也可以加载源文件,但是附加进程可以跳过文档启动过程,更方便)

  • 这个就是当前的运行程序,选择 WINWORD.EXE 程序

  • 让它运行起来

  • 打开 POC 文档触发异常

  • 此时汇编窗口是黑色的,凭经验判断是返回值错误导致的,离堆栈异常点最近的地方可以看出有一个叫 MSCOMCTL 的模块,地址是 0x275c8a0a

  • 载入 OD 运行

  • 由堆栈可知,在该函数返回的时候会被覆盖 0x41414141,故在函数开辟堆栈前先断下,重新运行,发现此时函数返回值还未被覆盖

  • 经过反复调试,发现执行完这个函数后返回值才被覆盖,所以进入这个函数

  • 终于在 0x275c87cb 中看到了可疑的复制指令,经过多次调试发现确实是这一个指令出了问题,指令执行之后,堆栈会被覆盖(edi 和 esi 满足条件后,这里要多执行几次)

  • 将有漏洞的模块载入到 IDA 当中,该模块是在 System32 中,并且基址和 0x275c87cb 相对应

  • 找到汇编指令漏洞触发点

  • 翻译成伪 C 代码,成功定位 memcpy 污点函数

0x04 追根溯源查找样本对应数据

  • 从 memcpy 的第三个参数入手,追根溯源;图中 ecx 就是复制的大小,也就是第三个参数,那么就追踪 ecx

  • 发现 ebx 传入 eax,而 ebx 的值又是 [ebp + 10h] 的地址,也就是 0x275c876d 函数的参数

  • 在 OD 中可以看到这个 0x8282 这个参数

  • 之后经过反复调试后,发现第一次调用该函数是获取样本中的 0x8282 这个数据,第二次调用该函数会将 0x8282 大小的数据复制到堆栈上造成溢出,再往下追根溯源就没有意义了

  • 这个就是样本中的数据,和覆盖返回值的 0x41414141 都在其中

0x05 利用 Offvis 工具定位样本中的格式字段

  • 本实验的 POC 是 RTF 格式,要想被 Offvis 认识,必须提取其中的 Word 格式,也就是图中的 D0CF…之后 ASCII 字符转换成 16 进制即可

  • 这里可以编写 python 脚本来实现转换(每两个字符变为一个 16 进制储存即可),这里为了方便利用 oletools 这个工具来转换

  • 这个就是转换好的 POC(提取码:8pb5) 文件,以 16 进制 DOCF 开头

  • 之后在 Offvis 中打开就可以了

  • 这里可以很清楚的看出,在 DirctoryEntries[4] 中的 OLESSDirctoryEntry[3] 中的 data 字段中出的问题

0x06 总结

  • 在污点函数方面,也就是出问题的函数 memcpy 并没有出乎我的意料,因为发生栈溢出无非是 memcpy,strcpy 等等函数
  • 在分析和对比样本中的数据和调试数据时,用到的方法也基本一致:定位异常触发点、跟踪堆栈找到问题函数、下内存断点进行污点跟踪和参数跟踪、使用工具对样本字段分析等等
  • 分析时从攻击者角度出发,理解是如何构造样本数据来挖掘漏洞的
  • 分析难点在于逆向理解函数,要清楚 C++ 、汇编和伪 C 代码之间的关系,尤其需要清楚 C++ 的指针和结构体在汇编中的调用,这需要扎实的逆向工程基础
  • 参考资料:0day安全:软件漏洞分析技术 + 漏洞战争

本次对于 CVE-2012-0158 堆溢出漏洞的分析到此结束,如有错误,欢迎指证