DroidRanger论文阅读笔记

3 Replies

NCSU的蒋旭宪教授团队去年在Android恶意代码发现上做出了有目共睹的成绩。昨天看到论文“Hey, You, Get off of My Market: Detecting Malicious Apps in Official and Alternative Android Markets”已经在其首页上公开，仔细阅读了一遍。做笔记如下。

文章主要介绍了名为DroidRanger的系统，用于从官方市场、第三方市场抓取和发现Android中已知家族和未知家族。

已知家族的策略是：

1. 基于已知家族所需必要权限，对所有灰名单样本过滤。例如，bgserv需要internet和收发短信权限，这样能过滤掉98.42%的灰名单样本。但也有例外，比如ddlight的过滤效果不好，则加上一个特定intent的receiver的规则来过滤；basebridge没有特殊权限，则用native代码来过滤。这样，每个家族的规则都能将灰名单样本过滤到5%以下。

2. 基于行为的特征匹配。包括三个方面的行为特征：manifest里注册的组件及其intent；特定组件（例如接收短信的receciver）的代码解析，提取API调用序列（例如invoke了abortBroadcast）；代码结构布局（即Java的树形结构源文件，但没想明白在这里怎么提取特征）。

在已知方面，他们基于10个已知家族（每个家族2个样本）提取了权限过滤规则和行为检测规则，在官方市场和第三方市场的20万个灰名单样本中发现这10个家族共119个新样本。

在未知家族检测上，策略是：

1. 基于启发式特征的过滤。这里的启发式特征并不是统一的单点特征集，而是真正体现样本潜在行为的复杂特征。例如，样本使用DexClassLoader加载从远程下载的jar或dex代码（但大部分是第三方广告，用白名单过滤掉）；样本在非默认路径lib/armeabi加载执行本地native code（常用于执行提权代码）。在这种启发式特征过滤下，把灰名单样本数量过滤到了1%以下。

2. 基于动态运行的行为监控。主要在两个层面做，对动态加载的jar和dex，记录其API调用及参数，例如sendTextMessage及其参数；对动态加载的native code，记录其发生的敏感系统调用，例如sys_mount（用于remount文件系统，常用于提权后写入系统分区的自我保护）。最后人工对这些日志进行分析。

在未知上，该团队由此发现Plankton（第一个DexClassLoader的恶意代码，官方市场，远控）和DroidKungfu（使用大量本地提权工具）。

从后续情况看，AnserverB应该也是被这种启发式规则触发而发现的。

论文提到还可以有其它启发式的特征，例如向高额扣费号码发送短信；将短信内容当成控制指令等。去年下半年该团队发现的很多新家族均有短信扣费和拦截的特点，猜测确实使用了这些特征。

关于已知检测的漏报问题，论文用contagio的公开样本进行了测试，称无漏报。

文中还提供了其他数据，例如对20万个样本的处理速度等。

总的来看，论文对细节公开的非常充分，取得的效果也很明显，值得我们学习。

SEAndroid

用于LaTeX的smali语法高亮文件

1 Reply

smali是对Dalvik虚拟机指令集的一种汇编语法，基于jasmin语法修改而来。在LaTeX中引用代码，一般使用listings宏包，最后一定修订于1999年的listings显然不会支持smali高亮，所以我写了这样一个文件，下载地址：

http://code.google.com/p/amatutor/source/browse/smali.sty

效果如下：

其中关键词和配色方案参考了lohan+在其博客http://androidcracking.blogspot.com中提供的smali for Vim/Notepad++/UltraEdit/SyntaxHighlighter的高亮文件。再次感谢lohan+的杰出工作。

以及，请关注使用了这一高亮文件的amatutor项目。

LaTeX中换行换页的表格

1 Reply

LaTeX中，表格一般用tabular。如果要表格内容自动换行，则需要使用tabularx宏包。在使用时，指定表格宽度和可能换行的列，例如：

\usepackage{tabularx}

\begin{tablularx}{\textwidth}{lX}
  aa & bbbbbbbbbbbbbbbbbbbbbbbb \\
\end{tabularx}

其中，由X指定的第二列就会根据表格中单元格的宽度自动换行了。

由于表格只是一个box，只能出现在同一页内。要使得表格能够换页，需要使用longtable宏包。例如：

\usepackage{longtable}

\begin{longtable}{ll}
  aa & bbbbbbbbbbbbbbbbbbbbbbbb \\
\end{tabularx}

如果希望两者兼得，该怎么办？有一个叫做ltxtable的宏包就综合了上述两个，能实现既有单元格换行，又有表格换页。比较麻烦的是，ltxtable要求表格内容单独保存为文件，为此再引入filecontents宏包，使表格内容和正文能在同一个文件之中。例如：

\usepackage{ltxtable, filecontents}

\begin{filecontents}{mytable1.tex}
  \begin{longtable}{lX}
    aa & bbbbbbbbbbbbbbbbbbbbbbbb \\
  \end{longtable}
\end{filecontents}

\LTXtable{\textwidth}{mytable1}

其中，filecontents宏包会将其中的内容单独保存为mytable1.tex文件。在这个文件中，longtable可以使用tabularx中的X符号指定要换行的单元格了。此后，调用ltxtable的LTXtable命令，指定表格宽度为\textwidth，并指定引用文件mytable1。这样就可以编译得到单元格内换行、整个表格可换页的表格了。

这里还有两个问题：

1、标题、标签怎么办？这个我还没有查到，尝试放在filecontents中会出错，在ltxtable的文档里也没有。如果有大牛看到这里知道该怎么办，请指教～

2、多出来的tex文件在版本管理里不好办，我的方法是，在filecontents里指定文件为mytable1.tmp而不是.tex后缀名；在LTXtable命令里使用文件全写mytable1.tmp而不是缩写；在.gitignore里忽略以.tmp结尾的临时文件；在Makefile的clean目标里删除.tmp结尾的文件即可。

除了使用ltxtable，还有两个宏包可以解决问题：ltablex和tabu。在stackoverflow上对此有过讨论。据说ltablex和caption会有冲突，但这两个我都没有用过。

最后，所有尝试都是在写amatutor的过程中产生的，欢迎大家继续关注这个项目～

i, Claud

DroidRanger论文阅读笔记

SEAndroid

用于LaTeX的smali语法高亮文件

LaTeX中换行换页的表格

2012年学习计划