ShadowHook 手册

ShadowHook Manual - English

介绍

ShadowHook 是一个 Android inline hook 库，它支持 thumb、arm32 和 arm64。

ShadowHook 现在被用于 TikTok，抖音，今日头条，西瓜视频，飞书中。

如果你需要的是 Android PLT hook 库，请移步到 ByteHook。

特征

支持 Android 4.1 - 14 (API level 16 - 34)。
支持 armeabi-v7a 和 arm64-v8a。
支持针对函数整体的 hook，不支持对函数中间位置的 hook。
支持通过“函数地址”或“库名 + 函数名”的方式指定 hook 位置。
自动完成“新加载动态库”的 hook（仅限“库名 + 函数名”方式），hook 完成后调用可选的回调函数。
可对同一个 hook 点并发执行多个 hook 和 unhook，彼此互不干扰（仅限 shared 模式）。
自动避免代理函数之间可能形成的递归调用和环形调用（仅限 shared 模式）。
代理函数中支持以正常的方式（CFI，EH，FP）回溯调用栈。
集成符号地址查找功能。
使用 MIT 许可证授权。

接入

在 build.gradle 中增加依赖

ShadowHook 发布在 Maven Central 上。为了使用 native 依赖项，ShadowHook 使用了从 Android Gradle Plugin 4.0+ 开始支持的 Prefab 包格式。

allprojects {
    repositories {
        mavenCentral()
    }
}

android {
    buildFeatures {
        prefab true
    }
}

dependencies {
    implementation 'com.bytedance.android:shadowhook:x.y.z'
}

x.y.z 请替换成版本号，建议使用最新的 release 版本。

注意：ShadowHook 使用 prefab package schema v2，它是从 Android Gradle Plugin 7.1.0 开始作为默认配置的。如果你使用的是 Android Gradle Plugin 7.1.0 之前的版本，请在 gradle.properties 中加入以下配置：

android.prefabVersion=2.0.0

在 CMakeLists.txt 或 Android.mk 中增加依赖

CMakeLists.txt

find_package(shadowhook REQUIRED CONFIG)

add_library(mylib SHARED mylib.c)
target_link_libraries(mylib shadowhook::shadowhook)

Android.mk

include $(CLEAR_VARS)
LOCAL_MODULE           := mylib
LOCAL_SRC_FILES        := mylib.c
LOCAL_SHARED_LIBRARIES += shadowhook
include $(BUILD_SHARED_LIBRARY)

$(call import-module,prefab/shadowhook)

指定一个或多个你需要的 ABI

android {
    defaultConfig {
        ndk {
            abiFilters 'armeabi-v7a', 'arm64-v8a'
        }
    }
}

增加打包选项

如果你是在一个 SDK 工程里使用 ShadowHook，你可能需要避免把 libshadowhook.so 打包到你的 AAR 里，以免 app 工程打包时遇到重复的 libshadowhook.so 文件。

android {
    packagingOptions {
        exclude '**/libshadowhook.so'
    }
}

另一方面, 如果你是在一个 APP 工程里使用 ShadowHook，你可以需要增加一些选项，用来处理重复的 libshadowhook.so 文件引起的冲突。

android {
    packagingOptions {
        pickFirst '**/libshadowhook.so'
    }
}

初始化

可以在 java 层或 native 层初始化，二选一即可。
java 层初始化逻辑实际上只做了两件事：System.loadLibrary、调用 native 层的 init 函数。
可以并发的多次的执行初始化，但只有第一次实际生效，后续的初始化调用将直接返回第一次初始化的返回值。

初始化参数

模式

shared 模式（默认值）：可对同一个 hook 点并发执行多个 hook 和 unhook，彼此互不干扰。自动避免代理函数之间可能形成的递归调用和环形调用。建议复杂的机构或组织使用 shared 模式。
unique 模式：同一个 hook 点只能被 hook 一次（unhook 后可以再次 hook）。需要自己处理代理函数之间可能形成的递归调用和环形调用。个人或小型的 app，或某些调试场景中（例如希望跳过 ShadowHook 的 proxy 管理机制，调试分析比较单纯的 inlinehook 流程），可以使用该模式。

调试日志

true：开启。调试信息将写入 logcat。tag：shadowhook_tag。
false（默认值）：关闭。

操作记录

true：开启。将 hook 和 unhook 操作记录写入内部 buffer。这些操作记录信息可以通过其他 API 获取。
false（默认值）：关闭。

Java API

package com.bytedance.shadowhook;

public class ShadowHook

public static int init()
public static int init(Config config)

返回 0 表示成功，非 0 表示失败（非 0 值为错误码）。

举例（使用默认初始化参数）

import com.bytedance.shadowhook.ShadowHook;

public class MySdk {
    public static void init() {
        ShadowHook.init();
    }
}

举例（通过Config参数指定更多选项）

import com.bytedance.shadowhook.ShadowHook;

public class MySdk {
    public static void init() {
        ShadowHook.init(new ShadowHook.ConfigBuilder()
            .setMode(ShadowHook.Mode.SHARED)
            .setDebuggable(true)
            .setRecordable(true)
            .build());
    }
}

Native API

#include "shadowhook.h"

typedef enum
{
    SHADOWHOOK_MODE_SHARED = 0,
    SHADOWHOOK_MODE_UNIQUE = 1
} shadowhook_mode_t;

int shadowhook_init(shadowhook_mode_t mode, bool debuggable);

返回 0 表示成功，非 0 表示失败（非 0 值为错误码）。

初始化相关的其他函数

模式在初始化时指定，之后不可修改。调试日志和操作记录可以在运行时随时开启和关闭。

Java API:

package com.bytedance.shadowhook;

public class ShadowHook

public static Mode getMode()

public static boolean getDebuggable()
public static void setDebuggable(boolean debuggable)

public static boolean getRecordable()
public static void setRecordable(boolean recordable)

Native API:

#include "shadowhook.h"

shadowhook_mode_t shadowhook_get_mode(void);

bool shadowhook_get_debuggable(void);
void shadowhook_set_debuggable(bool debuggable);

bool shadowhook_get_recordable(void);
void shadowhook_set_recordable(bool recordable);

查找符号地址

ShadowHook 的 hook API 支持通过“函数地址”或“库名 + 函数名”指定 hook 位置。
NDK 暴露的 .dynsym 中的函数地址可以借助 linker 来获取，但是 .symtab 和 .symtab in .gnu_debugdata 中的函数地址需要通过其他手段来获取。

#include "shadowhook.h"

void *shadowhook_dlopen(const char *lib_name);
void shadowhook_dlclose(void *handle);
void *shadowhook_dlsym(void *handle, const char *sym_name);
void *shadowhook_dlsym_dynsym(void *handle, const char *sym_name);
void *shadowhook_dlsym_symtab(void *handle, const char *sym_name);

这组 API 的用法类似于系统提供的 dlopen，dlclose，dlsym。
shadowhook_dlsym_dynsym 只能查找 .dynsym 中的符号，速度较快。
shadowhook_dlsym_symtab 能查找 .symtab 和 .symtab in .gnu_debugdata 中的符号，但是速度较慢。
shadowhook_dlsym 会先尝试在 .dynsym 中查找符号，如果找不到，会继续尝试在 .symtab 和 .symtab in .gnu_debugdata 中查找。

hook 和 unhook

支持通过“函数地址”或“库名 + 函数名”指定 hook 位置。
自动完成“新加载so库”的 hook（仅限“库名 + 函数名”方式），hook 完成后调用可选的回调函数。
只支持针对函数整体的 hook，不支持对函数中间位置的 hook。
如果要 hook 的函数不在 ELF 的符号表（.dynsym 或 .symtab 或 .symtab in .gnu_debugdata）中，则只能通过 shadowhook_hook_func_addr 来 hook，其他的 hook API 肯定无法 hook 成功。

1. 通过 “函数地址” hook 有符号信息的函数

#include "shadowhook.h"

void *shadowhook_hook_sym_addr(void *sym_addr, void *new_addr, void **orig_addr);

这种方式只能 hook “当前已加载到进程中的动态库”。

用 shadowhook_hook_sym_addr hook 的函数（sym_addr）必须存在于 ELF 的符号表（.dynsym / .symtab）中。可以用 readelf -sW 确认。

由于 ELF 的符号表中包含函数的长度信息，所以 ShadowHook 可以用这个信息来确认“hook 时修改的函数头部长度不会超过函数总长度”，这样做能提高 hook 的稳定性。

参数

sym_addr（必须指定）：需要被 hook 的函数的绝对地址。
new_addr（必须指定）：新函数（proxy 函数）的绝对地址。
orig_addr（不需要的话可传 NULL）：返回原函数地址。

返回值

非 NULL：hook 成功。返回值是个 stub，可保存返回值，后续用于 unhook。
NULL：hook 失败。可调用 shadowhook_get_errno 获取 errno，可继续调用 shadowhook_to_errmsg 获取 error message。

举例

void *orig;
void *stub = shadowhook_hook_sym_addr(malloc, my_malloc, &orig);
if(stub == NULL)
{
    int error_num = shadowhook_get_errno();
    const char *error_msg = shadowhook_to_errmsg(error_num);
    __android_log_print(ANDROID_LOG_WARN,  "test", "hook failed: %d - %s", error_num, error_msg);
}

在这个例子中，sym_addr 是由 linker 在加载当前动态库时指定的。

2. 通过 “函数地址” hook 无符号信息的函数

ShadowHook 从 1.0.4 版本开始提供 shadowhook_hook_func_addr。

#include "shadowhook.h"

void *shadowhook_hook_func_addr(void *func_addr, void *new_addr, void **orig_addr);

这种方式只能 hook “当前已加载到进程中的动态库”。

用 shadowhook_hook_func_addr hook 的函数（func_addr）可以不存在于 ELF 的符号表（.dynsym / .symtab）中。

此时需要使用者保证 func_addr 对应的函数足够长，不同架构和指令类型需要的函数长度如下：

架构	指令类型	最小函数长度（字节）	理想函数长度（字节）
arm32	thumb	4	10
arm32	arm32	4	8
arm64	arm64	4	16

注意：这里的函数长度指函数编译后生成的二进制 CPU 指令序列的长度，可以用 objdump 等工具确认。

实际函数长度 < 最小函数长度：arm32 和 arm64 肯定会出问题，thumb 可能会出问题。
最小函数长度 <= 实际函数长度 < 理想函数长度：也许会出问题，也许不会。或者有时会出问题，有时不会。
理想函数长度 <= 实际函数长度：肯定不会出问题。（仅指由于指令覆盖长度超过函数总长度引发的问题）

由此可见，相对于 shadowhook_hook_sym_addr 来说，shadowhook_hook_func_addr 的可靠性较差。因此建议仅在“被 hook 函数的指令长度可控”的情况下使用，例如：

通过 hook 某个无符号的函数，来修复特定机型特定 OS 版本的系统库 bug。
需要 hook 的函数是由某个特定版本的 API 返回的。例如 hook 特定版本的 Unity，通过 vulkan 提供的 vkGetInstanceProcAddr 获取需要 hook 的函数地址。

在这些“被 hook 的 ELF 文件的版本已知和可控”的情况下，即使使用 shadowhook_hook_func_addr 来执行 hook，我们也可以预先在开发阶段验证 hook 的稳定性。

参数

func_addr（必须指定）：需要被 hook 的函数的绝对地址。
new_addr（必须指定）：新函数（proxy 函数）的绝对地址。
orig_addr（不需要的话可传 NULL）：返回原函数地址。

返回值

非 NULL：hook 成功。返回值是个 stub，可保存返回值，后续用于 unhook。
NULL：hook 失败。可调用 shadowhook_get_errno 获取 errno，可继续调用 shadowhook_to_errmsg 获取 error message。

举例

void *orig;
void *func = get_hidden_func_addr();
void *stub = shadowhook_hook_func_addr(func, my_func, &orig);
if(stub == NULL)
{
    int error_num = shadowhook_get_errno();
    const char *error_msg = shadowhook_to_errmsg(error_num);
    __android_log_print(ANDROID_LOG_WARN,  "test", "hook failed: %d - %s", error_num, error_msg);
}

在这种方式中，func_addr 是由一个外部函数返回的，它在 ELF 中没有符号信息。

3. 通过 “库名 + 函数名” hook 函数

#include "shadowhook.h"

void *shadowhook_hook_sym_name(const char *lib_name, const char *sym_name, void *new_addr, void **orig_addr);

这种方式可以 hook “当前已加载到进程中的动态库”，也可以 hook “还没有加载到进程中的动态库”（如果 hook 时动态库还未加载，ShadowHook 内部会记录当前的 hook “诉求”，后续一旦目标动态库被加载到内存中，将立刻执行 hook 操作）。
ShadowHook 可以 hook ELF 中 .dynsym / .symtab / .symtab in .gnu_debugdata 中的符号，shadowhook_hook_sym_name 会完成符号地址查找的工作。
可以使用 readelf 查看 .dynsym / .symtab 中的符号。
可以使用 dd + xz + readelf 查看 .symtab in .gnu_debugdata 中的符号。
如果需要 hook “多个来自同一个动态库的符号”，建议使用 shadowhook_dl* API 来批量完成符号地址查找，这样可以加快 hook 流程中符号查找的速度。

参数

lib_name（必须指定）：符号所在 ELF 的 basename 或 pathname。对于在进程中确认唯一的动态库，可以只传 basename，例如：libart.so。对于不唯一的动态库，需要根据安卓版本和 arch 自己处理兼容性，例如：/system/lib64/libbinderthreadstate.so 和 /system/lib64/vndk-sp-29/libbinderthreadstate.so。否则，ShadowHook 只会 hook 进程中第一个匹配到 basename 的动态库。
sym_name（必须指定）：符号名。
new_addr（必须指定）：新函数（proxy 函数）的绝对地址。
orig_addr（不需要的话可传 NULL）：返回原函数地址。

返回值

非 NULL（errno == 0）：hook 成功。返回值是个 stub，可保存返回值，后续用于 unhook。
非 NULL（errno == 1）：由于目标动态库还没有加载，导致 hook 无法执行。ShadowHook 内部会记录当前的 hook “诉求”，后续一旦目标动态库被加载到内存中，将立刻执行 hook 操作。返回值是个 stub，可保存返回值，后续用于 unhook。
NULL：hook 失败。可调用 shadowhook_get_errno 获取 errno，可继续调用 shadowhook_to_errmsg 获取 error message。

举例

void *orig;
void *stub = shadowhook_hook_sym_name("libart.so", "_ZN3art9ArtMethod6InvokeEPNS_6ThreadEPjjPNS_6JValueEPKc", my_invoke, &orig);

int error_num = shadowhook_get_errno();
const char *error_msg = shadowhook_to_errmsg(error_num);
__android_log_print(ANDROID_LOG_WARN,  "test", "hook return: %p, %d - %s", stub, error_num, error_msg);

4. 通过“库名 + 函数名”执行 hook（需要 callback）

#include "shadowhook.h"

typedef void (*shadowhook_hooked_t)(int error_number, const char *lib_name, const char *sym_name, void *sym_addr, void *new_addr, void *orig_addr, void *arg);

void *shadowhook_hook_sym_name_callback(const char *lib_name, const char *sym_name, void *new_addr, void **orig_addr, shadowhook_hooked_t hooked, void *hooked_arg);

对于 hook “还没有加载到进程中的动态库”的情况，有时我们需要知道“当前 hook 诉求在未来的执行结果和执行时刻”。这时可以使用 shadowhook_hook_sym_name_callback 来额外指定一个 callback，当 hook 操作在未来（或此刻）被执行时，会调用这里的 callback。

参数

hooked（不需要的话可传 NULL）：当 hook 被执行后，调用该回调函数。回调函数的定义是shadowhook_hooked_t，其中第一个参数是 hook 执行的 errno，0 表示成功，非 0 失败（可调用 shadowhook_to_errmsg 获取 error message）。shadowhook_hooked_t 中后续参数对应 shadowhook_hook_sym_name_callback 中的各个参数。
hooked_arg（不需要的话可传 NULL）：hooked 回调函数中的最后一个参数（arg）。
其他参数和 shadowhook_hook_sym_name 相同。

返回值

含义和 shadowhook_hook_sym_name 相同。

举例

typedef void my_hooked_callback(int error_number, const char *lib_name, const char *sym_name, void *sym_addr, void *new_addr, void *orig_addr, void *arg);
{
    const char *error_msg = shadowhook_to_errmsg(error_number);
    __android_log_print(ANDROID_LOG_WARN,  "test", "hooked: %s, %s, %d - %s", lib_name, sym_name, error_number, error_msg);
}

void do_hook(void)
{
    void *orig;
    void *stub = shadowhook_hook_sym_name_callback("libart.so", "_ZN3art9ArtMethod6InvokeEPNS_6ThreadEPjjPNS_6JValueEPKc", my_invoke, &orig, my_hooked_callback, NULL);

    int error_num = shadowhook_get_errno();
    const char *error_msg = shadowhook_to_errmsg(error_num);
    __android_log_print(ANDROID_LOG_WARN,  "test", "hook return: %p, %d - %s", stub, error_num, error_msg);
}

5. unhook

#include "shadowhook.h"

int shadowhook_unhook(void *stub);

参数

stub（必须指定）：hook 函数返回的 stub 值。

返回值

0：unhook 成功。
-1：unhook 失败。可调用 shadowhook_get_errno 获取 errno，可继续调用 shadowhook_to_errmsg 获取 error message。

举例

int result = shadowhook_unhook(stub);
if(result != 0)
{
    int error_num = shadowhook_get_errno();
    const char *error_msg = shadowhook_to_errmsg(error_num);
    __android_log_print(ANDROID_LOG_WARN,  "test", "unhook failed: %d - %s", error_num, error_msg);
}

代理函数

代理函数需要定义成和原函数同样的类型（参数类型 + 返回值类型）。
无论 shared 模式还是 unique 模式，hook 函数都会通过 void **orig_addr 参数将原函数地址返回。

shared 模式中的代理函数

shared 模式中。在代理函数内部，请通过 SHADOWHOOK_CALL_PREV 宏调用原函数。在代理函数外部，请通过 orig_addr 调用原函数。

`SHADOWHOOK_CALL_PREV` 宏

#include "shadowhook.h"

#ifdef __cplusplus
#define SHADOWHOOK_CALL_PREV(func, ...) ...
#else
#define SHADOWHOOK_CALL_PREV(func, func_sig, ...) ...
#endif

用于在代理函数中调用原函数。在代理函数中也可以不调用原函数，但请不要通过函数名或 orig_addr 来直接调用原函数。
在 C++ 源文件中的用法是：第一个参数传递当前的代理函数的地址，后面按照顺序依次传递函数的各个参数。
在 C 源文件中的用法是：第一个参数传递当前的代理函数的地址，第二个参数传递当前 hook 的函数的类型定义，后面按照顺序依次传递函数的各个参数。

`SHADOWHOOK_POP_STACK` 宏和 `SHADOWHOOK_STACK_SCOPE` 宏

#include "shadowhook.h"

// pop stack in proxy-function (for C/C++)
#define SHADOWHOOK_POP_STACK() ...

// pop stack in proxy-function (for C++ only)
#define SHADOWHOOK_STACK_SCOPE() ...

ShadowHook 的代理函数管理机制完成了一些事情：

可对同一个 hook 点多次 hook 和 unhook，彼此互不干扰。
自动避免代理函数之间可能形成的递归调用和环形调用（比如：SDK1 的 open_proxy 中调用了 read，SDK2 的 read_proxy 中又调用了 open）。
代理函数中可以用常规的方式回溯调用栈。

为了同时做到上面这些，需要在代理函数中做一些额外的事情，即“执行 ShadowHook 内部的 stack 清理”，这需要你在 proxy 函数中调用 SHADOWHOOK_POP_STACK 宏或 SHADOWHOOK_STACK_SCOPE 宏来完成（二选一）。注意：即使你在代理函数中什么也不做，也需要“执行 ShadowHook 内部的 stack 清理”。

SHADOWHOOK_POP_STACK 宏：适用于 C 和 C++ 源文件。需要确保在代理函数返回前调用。
SHADOWHOOK_STACK_SCOPE 宏：适用于 C++ 源文件。在代理函数开头调用一次即可。

`SHADOWHOOK_RETURN_ADDRESS` 宏

#include "shadowhook.h"

// get return address in proxy-function
#define SHADOWHOOK_RETURN_ADDRESS() ...

偶尔，你可能需要在代理函数中通过 __builtin_return_address(0) 获取 LR 的值，由于 shared 模式中 trampoline 改变了 LR，直接调用 __builtin_return_address(0) 将返回 trampoline 的地址。

在代理函数中，需要通过 SHADOWHOOK_RETURN_ADDRESS 宏来获取原始的 LR。

`SHADOWHOOK_ALLOW_REENTRANT` 宏和 `SHADOWHOOK_DISALLOW_REENTRANT` 宏

#include "shadowhook.h"

// allow reentrant of the current proxy-function
#define SHADOWHOOK_ALLOW_REENTRANT() ...

// disallow reentrant of the current proxy-function
#define SHADOWHOOK_DISALLOW_REENTRANT() ...

在 shared 模式中，默认是不允许 proxy 函数被重入的，因为重入可能发生在多个使用 ShadowHook 的 SDK 之间，最终形成了一个无限循环的调用环（比如：SDK1 的 open_proxy 中调用了 read，SDK2 的 read_proxy 中又调用了 open）。

但是，某些特殊使用场景中，由业务逻辑控制的重入可能是需要的，他们并不会形成“无限的”调用环，而是会在某些业务条件满足时终止。如果你确认你的使用场景是这种情况，请在 proxy 函数中调用 SHADOWHOOK_ALLOW_REENTRANT 以允许重入，当 proxy 函数的逻辑运行到“不再需要允许重入的部分”时，可以调用 SHADOWHOOK_DISALLOW_REENTRANT。

举例一（C源文件）

void *orig;
void *stub;

typedef void *(*malloc_t)(size_t);

void *malloc_proxy(size_t sz)
{
    if(sz > 1024)
    {
        // 执行 stack 清理（不可省略）
        SHADOWHOOK_POP_STACK();
        return NULL;
    }

    // 调用原函数
    void *result = SHADOWHOOK_CALL_PREV(malloc_proxy, malloc_t, sz);

    // 执行 stack 清理（不可省略）
    SHADOWHOOK_POP_STACK();
    return result;
} 

void do_hook(void)
{
    stub = shadowhook_hook_sym_addr(malloc, malloc_proxy, &orig);
}

void do_unhook(void)
{
    shadowhook_unhook(stub);
    stub = NULL;
}

void *my_malloc_4k(void)
{
    // 在某些场景中，也许你需要直接调用原函数。
    return ((malloc_t)orig)(4096);
}

举例二（C++源文件）

void *orig;
void *stub;

typedef void *(*malloc_t)(size_t);

void * malloc_proxy(size_t sz)
{
    // 执行 stack 清理（不可省略），只需调用一次
    SHADOWHOOK_STACK_SCOPE();
    
    if(sz > 1024)
        return nullptr;

    // 调用原函数
    return SHADOWHOOK_CALL_PREV(malloc_proxy, sz);
} 

void do_hook(void)
{
    stub = shadowhook_hook_sym_addr(malloc, malloc_proxy, &orig);
}

void do_unhook(void)
{
    shadowhook_unhook(stub);
    stub = NULL;
} 

void *my_malloc_4k(void)
{
    // 在某些场景中，也许你需要直接调用原函数。
    return ((malloc_t)orig)(4096);
}

举例三（控制 proxy 函数是否可重入）

int test_func_2(int a, int b)
{
    a--; // a 每次递减 1
    return test_func_1(a, b);
}

int test_func_1(int a, int b)
{
    if(a < b)
        return 0;
    else
        return test_func_2(a, b);
}

void test(void)
{
    test_func_1(10, 5);
}

test_func_1 和 test_func_2 看似会形成一个无限循环的环形调用，但是当 a < b 时，循环会终止，所以并不会真的死循环。（test 函数中调用 test_func_1 的参数是 a = 10 和 b = 5，每次 test_func_2 中将 a 递减 1）

默认情况下 ShadowHook 会阻止 proxy 函数的重入，因为重入很容易导致 proxy 函数之间形成死循环。但如果这种 proxy 函数的重入正是你所需要的，请参考下面的例子用 SHADOWHOOK_ALLOW_REENTRANT 宏和 SHADOWHOOK_DISALLOW_REENTRANT 宏来控制 proxy 函数中某个代码区域的“可重入性”：

下面的代码hook test_func_1，其中使用 SHADOWHOOK_ALLOW_REENTRANT 宏来允许重入。

void *stub;

int test_func_1_proxy(int a, int b)
{
    // 执行 stack 清理（不可省略），只需调用一次
    SHADOWHOOK_STACK_SCOPE();
    
    // 加点自己的业务逻辑
    if(a > 1024 || b > 1024)
        return -1;

    // 下面开始调用原函数了，我们希望每次对 test_func_1 的调用都走入我们的代理函数中。
    SHADOWHOOK_ALLOW_REENTRANT();

    // 调用原函数
    int result = SHADOWHOOK_CALL_PREV(test_func_1_proxy, sz);
    
    // 下面要继续加点业务逻辑，想恢复 ShadowHook 的“防止 proxy 函数被重入”的保护功能。
    SHADOWHOOK_DISALLOW_REENTRANT();
    
    // 继续加点业务逻辑
    write_log(global_log_fd, "test_func_1 called with a=%d, b=%d", a, b);
    
    return result;
} 

void do_hook(void)
{
    stub = shadowhook_hook_sym_addr(test_func_1, test_func_1_proxy, NULL);
}

void do_unhook(void)
{
    shadowhook_unhook(stub);
    stub = NULL;
}

unique模式中的代理函数

unique 模式中。请始终通过 hook 函数返回的原函数地址 orig_addr 调用原函数。

举例

void *orig;
void *stub;

typedef void *(*malloc_t)(size_t);

void *my_malloc(size_t sz)
{
    if(sz > 1024)
        return nullptr;

    // 调用原函数
    return ((malloc_t)orig)(sz);
}

void do_hook(void)
{
    stub = shadowhook_hook_sym_addr(malloc, my_malloc, &orig);
}

void do_unhook(void)
{
    shadowhook_unhook(stub);
    stub = NULL;
}

错误码

0：成功。
1：“通过库名 + 函数名执行的 hook”由于动态库没有加载，而无法完成，当前 hook 诉求处于 pending 状态。
其他：各种其他错误。

Java API

package com.bytedance.shadowhook;

public class ShadowHook

public static String toErrmsg(int errno)

init 返回“非 0”，表示初始化失败，此时 init 的返回值就是 errno。
通过 toErrmsg 可以获取 errno 对应的 error message。

Native API

#include "shadowhook.h"

int shadowhook_get_errno(void);
const char *shadowhook_to_errmsg(int error_number);

shadowhook_init 返回“非 0”，表示初始化失败。此时 shadowhook_init 的返回值就是 errno。
shadowhook_hook_* 返回 NULL 表示失败；shadowhook_unhook 返回 -1 表示失败。此时通过 shadowhook_get_errno 可以获取到 errno。
通过 shadowhook_to_errmsg 可以获取 errno 对应的 error message。

操作记录

ShadowHook 会在内存中记录 hook / unhook 的操作信息。
可以在 java 层或 native 层获取这些操作记录，它们以字符串形式返回，以行为单位，以逗号分隔信息项。
具体可以返回的信息项和顺序如下：

顺序	名称	描述	备注
1	TIMESTAMP	时间戳	格式：YYYY-MM-DDThh:mm:ss.sss+hh:mm
2	CALLER_LIB_NAME	调用者动态库名称	basename
3	OP	操作类型	hook_sym_addr / hook_sym_name / unhook / error
4	LIB_NAME	目标函数所在动态库名称	仅 hook 有效
5	SYM_NAME	目标函数名称	仅 hook 有效
6	SYM_ADDR	目标函数地址	仅 hook 有效
7	NEW_ADDR	proxy函数地址	仅 hook 有效
8	BACKUP_LEN	覆盖的函数头部的指令长度	仅 hook 有效。arm32：4 / 8 / 10；arm64：4 / 16
9	ERRNO	错误码
10	STUB	hook 返回的 stub	是个指针类型的数值，hook 和 unhook 可以通过这个值来配对

Java API

package com.bytedance.shadowhook;

public class ShadowHook

public static String getRecords(RecordItem... recordItems)

public enum RecordItem {
    TIMESTAMP,
    CALLER_LIB_NAME,
    OP,
    LIB_NAME,
    SYM_NAME,
    SYM_ADDR,
    NEW_ADDR,
    BACKUP_LEN,
    ERRNO,
    STUB
}

如果调用 getRecords 时不传递任何参数，则表示获取所有的信息项。
如果你只想收集统计一些 app 的 hook / unhook 操作信息以及 errno，那么使用 java API 会更方便。

Native API

#include "shadowhook.h"

#define SHADOWHOOK_RECORD_ITEM_ALL             0x3FF // 0b1111111111
#define SHADOWHOOK_RECORD_ITEM_TIMESTAMP       (1 << 0)
#define SHADOWHOOK_RECORD_ITEM_CALLER_LIB_NAME (1 << 1)
#define SHADOWHOOK_RECORD_ITEM_OP              (1 << 2)
#define SHADOWHOOK_RECORD_ITEM_LIB_NAME        (1 << 3)
#define SHADOWHOOK_RECORD_ITEM_SYM_NAME        (1 << 4)
#define SHADOWHOOK_RECORD_ITEM_SYM_ADDR        (1 << 5)
#define SHADOWHOOK_RECORD_ITEM_NEW_ADDR        (1 << 6)
#define SHADOWHOOK_RECORD_ITEM_BACKUP_LEN      (1 << 7)
#define SHADOWHOOK_RECORD_ITEM_ERRNO           (1 << 8)
#define SHADOWHOOK_RECORD_ITEM_STUB            (1 << 9)

char *shadowhook_get_records(uint32_t item_flags);
void shadowhook_dump_records(int fd, uint32_t item_flags);

通过 item_flags 参数可指定需要返回哪些信息项，需要返回所有信息项时可使用 SHADOWHOOK_RECORD_ITEM_ALL。
shadowhook_get_records 返回的 buffer 是用 malloc 分配的，你需要用 free 来释放它。
shadowhook_dump_records 会将内容写入 fd 中，这个函数是异步信号安全的，你可以在信号处理函数中使用它。例如，在发生native崩溃后，在信号处理函数中调用 shadowhook_dump_records，将 hook / unhook 操作信息写入你自己的 tombstone 文件中。

Bytedance Inc. / android-inline-hook .gitee-modal { width: 500px !important; }

ShadowHook 手册

介绍

特征

接入

在 build.gradle 中增加依赖

在 CMakeLists.txt 或 Android.mk 中增加依赖

指定一个或多个你需要的 ABI

增加打包选项

初始化

初始化参数

模式

调试日志

操作记录

Java API

举例（使用默认初始化参数）

举例（通过Config参数指定更多选项）

Native API

初始化相关的其他函数

查找符号地址

hook 和 unhook

1. 通过 “函数地址” hook 有符号信息的函数

参数

返回值

举例

2. 通过 “函数地址” hook 无符号信息的函数

参数

返回值

举例

3. 通过 “库名 + 函数名” hook 函数

参数

返回值

举例

4. 通过“库名 + 函数名”执行 hook（需要 callback）

参数

返回值

举例

5. unhook

参数

返回值

举例

代理函数

shared 模式中的代理函数

SHADOWHOOK_CALL_PREV 宏

SHADOWHOOK_POP_STACK 宏和 SHADOWHOOK_STACK_SCOPE 宏

SHADOWHOOK_RETURN_ADDRESS 宏

SHADOWHOOK_ALLOW_REENTRANT 宏和 SHADOWHOOK_DISALLOW_REENTRANT 宏

举例一（C源文件）

举例二（C++源文件）

举例三（控制 proxy 函数是否可重入）

unique模式中的代理函数

举例

错误码

Java API

Native API

操作记录

Java API

Native API

简介

发行版

开源评估指数源自 OSS-Compass 评估体系，评估体系围绕以下三个维度对项目展开评估：

贡献者

近期动态

搜索帮助

Bytedance Inc. / android-inline-hook

`SHADOWHOOK_CALL_PREV` 宏

`SHADOWHOOK_POP_STACK` 宏和 `SHADOWHOOK_STACK_SCOPE` 宏

`SHADOWHOOK_RETURN_ADDRESS` 宏

`SHADOWHOOK_ALLOW_REENTRANT` 宏和 `SHADOWHOOK_DISALLOW_REENTRANT` 宏