python提取android工程代码中的一些数据
创始人
2025-05-28 03:18:32
0

事情是这样的,由于一些原因我需要把Java代码中的一些关键词筛选出来,并将其行号,命中内容等都筛选出来。以此为数据源做后续的扫描识别工作。

分析目标关键词类型,可以分为两类:字符串和库对象引用。

  • 字符串样例:"android.permission.READ_CALENDAR"
  • 库对象引用样例Manifest.permission.CAMERA

所以首先就是把工程中的java文件都读入到内存中,然后按行遍历内容,逐个匹配关键字,当匹配上后,就记录文件、行号以及命中内容。很好,很简单。于是有了下面的代码。

import re
import osPERMISSION_PATTERN = [r'android.permission.[a-zA-Z]*', r'Manifest.permission.[a-zA-Z]*']# 获取某目录下所有的java文件路径
def read_all_java(file_dir):# 读取目录下所有Java的内容def find_all_permission_statement_place(line):for p in PERMISSION_PATTERN:find = re.findall(p, line)if find:return find[0]return None

看起来很不错,我甚至用了个常量组,方便日后的扩展。我真是个小天才。

但是当脚本跑起来后,有几个已知的代码段落没有被识别出来。对于一个想要用脚本偷懒的人来说,漏场景实在是太可怕了,于是赶紧分析被遗漏的场景。经分析,这些被遗漏的场景是由于Java代码格式化时,由于某行代码过长而换行导致的。如下例。

    String pe = Manifest.permission.CAMERA;

这种这行实在是太讨厌了,举一反三,除了这种对象链换行,还有一种字符串换行。所以,如果想用上面的代码段将所有场景都扫描出来,我们需要将折行的代码重新拼接起来。

	public static final String WRITE_EXTERNAL_STORAGE = "android.permission" +".WRITE_EXTERNAL_STORAGE"

经分析,可以将目前两种目标关键字的折行类型分为四种,分别为,“.”行首、“.”行尾、“+”行首、“+”行尾。

    // “.”行首String pe = Manifest.permission.CAMERA;
    // “.”行尾String pe = Manifest.permission.CAMERA;
    // "+"行首 public static final String WRITE_EXTERNAL_STORAGE = "android.permission"+ ".WRITE_EXTERNAL_STORAGE"
    // "+"行尾public static final String WRITE_EXTERNAL_STORAGE = "android.permission" +".WRITE_EXTERNAL_STORAGE"

对于上述四种场景,我们需要对原始数据进行一次清洗。具体实现如下。

def read_file_and_format(file_dir):"""读取文件内容,以列表形式返回会将其因为格式化而造成的".","+"换行恢复"""origin_data = read_file(file_dir)result = []index = 0point_cache = Noneplus_sign_cache = Nonefor d in origin_data:# 行首"."换行处理if d.strip().startswith("."):pre_line = result[index - 1]result[index - 1] = (pre_line + d.strip())continue# 行尾"."换行处理if point_cache:d = point_cache + d.strip()point_cache = Noneif d.strip().endswith("."):point_cache = d.replace("\n", "")continue# 行首字符串"+"换行处理if d.strip().startswith("+"):find = re.findall(r'[\+][\s*]["]', d.strip())if find:pre_line = result[index - 1].strip()[:-1]result[index - 1] = pre_line + d.strip().replace(find[0], "")continue# 行尾字符串"+"换行处理if plus_sign_cache:d = plus_sign_cache + d.strip()[1:len(d)]plus_sign_cache = Noneif d.strip().endswith("+"):find = re.findall(r'["][\s*][\+]', d.strip())if find:plus_sign_cache = d.strip().replace(find[0], "").replace("\n", "")continueindex = index + 1result.append(d.replace("\n", ""))return result

上述处理很土鳖,就是遍历整体文件,然后按照特征找出对应的行,上下拼接。好歹把功能实现了,其中使用的正则都是我一点一点试出来的,挺费劲,记录一下,以资来者。

这个过程中有个坑,就是习惯了Java的replace支持正则替换,但python的replace不支持,在这里无效定位了半天。

另外,其实聪明如你的小伙伴已经看出来了,我其实想要使用python脚本来把Android权限相关内容提取出来,这块不清楚有没有比较牛的python库可以直接解析Java文件,然后返回python中可以直接调用的类、方法、成员变量等等的数据结构。望大神们清楚地点拨一二,小子不胜感激。

相关内容

热门资讯

安卓9系统怎样应用分身,轻松实... 你有没有发现,手机里的APP越来越多,有时候一个APP里还要处理好多任务,分身功能简直就是救星啊!今...
获取安卓系统的ip地址,轻松获... 你有没有想过,你的安卓手机里隐藏着一个神秘的IP地址?没错,就是那个能让你在网络世界里找到自己的小秘...
LG彩电安卓系统升级,畅享智能... 你家的LG彩电是不是最近有点儿“闹别扭”,屏幕上时不时地跳出个升级提示?别急,今天就来给你详细说说这...
阴阳师安卓苹果系统,安卓与苹果... 亲爱的玩家们,你是否曾在深夜里,手握手机,沉浸在阴阳师的神秘世界?今天,就让我带你一起探索这款风靡全...
华为安卓系统区别在哪,独特创新... 你知道吗?最近手机圈里可是热闹非凡,尤其是华为的新动作,让很多人眼睛都瞪大了。没错,我说的就是华为自...
怎么重新刷安卓手机系统,深度解... 手机用久了,是不是感觉卡顿得厉害?别急,今天就来教你怎么重新刷安卓手机系统,让你的手机焕然一新,速度...
刷正版安卓系统教程,刷正版安卓... 你有没有想过,让你的安卓手机焕然一新,体验一把正版系统的魅力呢?别急,今天就来手把手教你如何刷正版安...
移动支撑系统安卓版,助力移动办... 你有没有发现,现在的生活越来越离不开手机了?无论是工作还是娱乐,手机几乎成了我们生活的必需品。而今天...
安卓怎么进win系统界面,安卓... 亲爱的安卓用户,你是否曾幻想过在安卓设备上直接体验Windows系统的魅力?别再羡慕那些Window...
incall可以升级安卓系统吗... 你有没有想过,你的手机是不是也能像电脑一样,时不时地来个系统升级呢?今天,咱们就来聊聊这个话题——i...
安卓系统带农历软件,尽享传统节... 你知道吗?现在智能手机上有个特别实用的功能,那就是农历显示。对于咱们中国人来说,农历可是有着深厚的历...
安卓系统资源占用高,揭秘原因与... 你有没有发现,你的安卓手机最近变得越来越慢了?是不是觉得打开一个应用都要等半天,甚至有时候还会卡死?...
安卓10的系统有哪些,功能升级... 你有没有发现,你的安卓手机最近是不是变得有点不一样了?没错,就是那个神秘的安卓10系统!它就像一位魔...
固态硬盘系统迁移到安卓,固态硬... 你有没有想过,把你的固态硬盘系统迁移到安卓设备上,是不是能让你在移动办公或者娱乐时更加得心应手呢?想...
平板电脑能玩安卓系统吗,畅享丰... 你有没有想过,平板电脑竟然也能玩安卓系统?这可不是天方夜谭,而是科技发展的新趋势。想象你手中的平板瞬...
安卓刷精简系统下载,轻松打造高... 你有没有想过,你的安卓手机是不是有点儿“臃肿”了呢?运行速度慢,电池续航短,有时候还卡得要命。别急,...
安卓子系统windows11,... 你知道吗?最近科技圈可是炸开了锅,因为安卓子系统在Windows 11上的兼容性成了大家热议的话题。...
电脑里怎么下载安卓系统,电脑端... 你有没有想过,你的电脑里也能装上安卓系统呢?没错,就是那个让你手机不离手的安卓!今天,就让我来带你一...
索尼相机魔改安卓系统,魔改系统... 你知道吗?最近在摄影圈里掀起了一股热潮,那就是索尼相机魔改安卓系统。这可不是一般的改装,而是让这些专...
安卓系统哪家的最流畅,安卓系统... 你有没有想过,为什么你的手机有时候像蜗牛一样慢吞吞的,而别人的手机却能像风一样快?这背后,其实就是安...