python提取android工程代码中的一些数据
创始人
2025-05-28 03:18:32
0

事情是这样的,由于一些原因我需要把Java代码中的一些关键词筛选出来,并将其行号,命中内容等都筛选出来。以此为数据源做后续的扫描识别工作。

分析目标关键词类型,可以分为两类:字符串和库对象引用。

  • 字符串样例:"android.permission.READ_CALENDAR"
  • 库对象引用样例Manifest.permission.CAMERA

所以首先就是把工程中的java文件都读入到内存中,然后按行遍历内容,逐个匹配关键字,当匹配上后,就记录文件、行号以及命中内容。很好,很简单。于是有了下面的代码。

import re
import osPERMISSION_PATTERN = [r'android.permission.[a-zA-Z]*', r'Manifest.permission.[a-zA-Z]*']# 获取某目录下所有的java文件路径
def read_all_java(file_dir):# 读取目录下所有Java的内容def find_all_permission_statement_place(line):for p in PERMISSION_PATTERN:find = re.findall(p, line)if find:return find[0]return None

看起来很不错,我甚至用了个常量组,方便日后的扩展。我真是个小天才。

但是当脚本跑起来后,有几个已知的代码段落没有被识别出来。对于一个想要用脚本偷懒的人来说,漏场景实在是太可怕了,于是赶紧分析被遗漏的场景。经分析,这些被遗漏的场景是由于Java代码格式化时,由于某行代码过长而换行导致的。如下例。

    String pe = Manifest.permission.CAMERA;

这种这行实在是太讨厌了,举一反三,除了这种对象链换行,还有一种字符串换行。所以,如果想用上面的代码段将所有场景都扫描出来,我们需要将折行的代码重新拼接起来。

	public static final String WRITE_EXTERNAL_STORAGE = "android.permission" +".WRITE_EXTERNAL_STORAGE"

经分析,可以将目前两种目标关键字的折行类型分为四种,分别为,“.”行首、“.”行尾、“+”行首、“+”行尾。

    // “.”行首String pe = Manifest.permission.CAMERA;
    // “.”行尾String pe = Manifest.permission.CAMERA;
    // "+"行首 public static final String WRITE_EXTERNAL_STORAGE = "android.permission"+ ".WRITE_EXTERNAL_STORAGE"
    // "+"行尾public static final String WRITE_EXTERNAL_STORAGE = "android.permission" +".WRITE_EXTERNAL_STORAGE"

对于上述四种场景,我们需要对原始数据进行一次清洗。具体实现如下。

def read_file_and_format(file_dir):"""读取文件内容,以列表形式返回会将其因为格式化而造成的".","+"换行恢复"""origin_data = read_file(file_dir)result = []index = 0point_cache = Noneplus_sign_cache = Nonefor d in origin_data:# 行首"."换行处理if d.strip().startswith("."):pre_line = result[index - 1]result[index - 1] = (pre_line + d.strip())continue# 行尾"."换行处理if point_cache:d = point_cache + d.strip()point_cache = Noneif d.strip().endswith("."):point_cache = d.replace("\n", "")continue# 行首字符串"+"换行处理if d.strip().startswith("+"):find = re.findall(r'[\+][\s*]["]', d.strip())if find:pre_line = result[index - 1].strip()[:-1]result[index - 1] = pre_line + d.strip().replace(find[0], "")continue# 行尾字符串"+"换行处理if plus_sign_cache:d = plus_sign_cache + d.strip()[1:len(d)]plus_sign_cache = Noneif d.strip().endswith("+"):find = re.findall(r'["][\s*][\+]', d.strip())if find:plus_sign_cache = d.strip().replace(find[0], "").replace("\n", "")continueindex = index + 1result.append(d.replace("\n", ""))return result

上述处理很土鳖,就是遍历整体文件,然后按照特征找出对应的行,上下拼接。好歹把功能实现了,其中使用的正则都是我一点一点试出来的,挺费劲,记录一下,以资来者。

这个过程中有个坑,就是习惯了Java的replace支持正则替换,但python的replace不支持,在这里无效定位了半天。

另外,其实聪明如你的小伙伴已经看出来了,我其实想要使用python脚本来把Android权限相关内容提取出来,这块不清楚有没有比较牛的python库可以直接解析Java文件,然后返回python中可以直接调用的类、方法、成员变量等等的数据结构。望大神们清楚地点拨一二,小子不胜感激。

相关内容

热门资讯

电视安卓系统哪个品牌好,哪家品... 你有没有想过,家里的电视是不是该升级换代了呢?现在市面上电视品牌琳琅满目,各种操作系统也是让人眼花缭...
安卓会员管理系统怎么用,提升服... 你有没有想过,手机里那些你爱不释手的APP,背后其实有个强大的会员管理系统在默默支持呢?没错,就是那...
安卓系统软件使用技巧,解锁软件... 你有没有发现,用安卓手机的时候,总有一些小技巧能让你玩得更溜?别小看了这些小细节,它们可是能让你的手...
安卓系统提示音替换 你知道吗?手机里那个时不时响起的提示音,有时候真的能让人心情大好,有时候又让人抓狂不已。今天,就让我...
安卓开机不了系统更新 手机突然开不了机,系统更新还卡在那里,这可真是让人头疼的问题啊!你是不是也遇到了这种情况?别急,今天...
安卓系统中微信视频,安卓系统下... 你有没有发现,现在用手机聊天,视频通话简直成了标配!尤其是咱们安卓系统的小伙伴们,微信视频功能更是用...
安卓系统是服务器,服务器端的智... 你知道吗?在科技的世界里,安卓系统可是个超级明星呢!它不仅仅是个手机操作系统,竟然还能成为服务器的得...
pc电脑安卓系统下载软件,轻松... 你有没有想过,你的PC电脑上安装了安卓系统,是不是瞬间觉得世界都大不一样了呢?没错,就是那种“一机在...
电影院购票系统安卓,便捷观影新... 你有没有想过,在繁忙的生活中,一部好电影就像是一剂强心针,能瞬间让你放松心情?而我今天要和你分享的,...
安卓系统可以写程序? 你有没有想过,安卓系统竟然也能写程序呢?没错,你没听错!这个我们日常使用的智能手机操作系统,竟然有着...
安卓系统架构书籍推荐,权威书籍... 你有没有想过,想要深入了解安卓系统架构,却不知道从何下手?别急,今天我就要给你推荐几本超级实用的书籍...
安卓系统看到的炸弹,技术解析与... 安卓系统看到的炸弹——揭秘手机中的隐形威胁在数字化时代,智能手机已经成为我们生活中不可或缺的一部分。...
鸿蒙系统有安卓文件,畅享多平台... 你知道吗?最近在科技圈里,有个大新闻可是闹得沸沸扬扬的,那就是鸿蒙系统竟然有了安卓文件!是不是觉得有...
宝马安卓车机系统切换,驾驭未来... 你有没有发现,现在的汽车越来越智能了?尤其是那些豪华品牌,比如宝马,它们的内饰里那个大屏幕,简直就像...
p30退回安卓系统 你有没有听说最近P30的用户们都在忙活一件大事?没错,就是他们的手机要退回安卓系统啦!这可不是一个简...
oppoa57安卓原生系统,原... 你有没有发现,最近OPPO A57这款手机在安卓原生系统上的表现真是让人眼前一亮呢?今天,就让我带你...
安卓系统输入法联想,安卓系统输... 你有没有发现,手机上的输入法真的是个神奇的小助手呢?尤其是安卓系统的输入法,简直就是智能生活的点睛之...
怎么进入安卓刷机系统,安卓刷机... 亲爱的手机控们,你是否曾对安卓手机的刷机系统充满好奇?想要解锁手机潜能,体验全新的系统魅力?别急,今...
安卓系统程序有病毒 你知道吗?在这个数字化时代,手机已经成了我们生活中不可或缺的好伙伴。但是,你知道吗?即使是安卓系统,...
奥迪中控安卓系统下载,畅享智能... 你有没有发现,现在汽车的中控系统越来越智能了?尤其是奥迪这种豪华品牌,他们的中控系统简直就是科技与艺...