Informations de base sur ELF

Tip

Apprenez et pratiquez le hacking AWS :HackTricks Training AWS Red Team Expert (ARTE)
Apprenez et pratiquez le hacking GCP : HackTricks Training GCP Red Team Expert (GRTE) Apprenez et pratiquez le hacking Azure : HackTricks Training Azure Red Team Expert (AzRTE)

Soutenir HackTricks

En-têtes de programme

Ils décrivent au chargeur comment charger l’ELF en mémoire :

readelf -lW lnstat

Elf file type is DYN (Position-Independent Executable file)
Entry point 0x1c00
There are 9 program headers, starting at offset 64

Program Headers:
Type           Offset   VirtAddr           PhysAddr           FileSiz  MemSiz   Flg Align
PHDR           0x000040 0x0000000000000040 0x0000000000000040 0x0001f8 0x0001f8 R   0x8
INTERP         0x000238 0x0000000000000238 0x0000000000000238 0x00001b 0x00001b R   0x1
[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]
LOAD           0x000000 0x0000000000000000 0x0000000000000000 0x003f7c 0x003f7c R E 0x10000
LOAD           0x00fc48 0x000000000001fc48 0x000000000001fc48 0x000528 0x001190 RW  0x10000
DYNAMIC        0x00fc58 0x000000000001fc58 0x000000000001fc58 0x000200 0x000200 RW  0x8
NOTE           0x000254 0x0000000000000254 0x0000000000000254 0x0000e0 0x0000e0 R   0x4
GNU_EH_FRAME   0x003610 0x0000000000003610 0x0000000000003610 0x0001b4 0x0001b4 R   0x4
GNU_STACK      0x000000 0x0000000000000000 0x0000000000000000 0x000000 0x000000 RW  0x10
GNU_RELRO      0x00fc48 0x000000000001fc48 0x000000000001fc48 0x0003b8 0x0003b8 R   0x1

Section to Segment mapping:
Segment Sections...
00
01     .interp
02     .interp .note.gnu.build-id .note.ABI-tag .note.package .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
03     .init_array .fini_array .dynamic .got .data .bss
04     .dynamic
05     .note.gnu.build-id .note.ABI-tag .note.package
06     .eh_frame_hdr
07
08     .init_array .fini_array .dynamic .got

The previous program has 9 program headers, then, the segment mapping indicates in which program header (from 00 to 08) each section is located.

PHDR - Program HeaDeR

Contains the program header tables and metadata itself.

INTERP

Indicates the path of the loader to use to load the binary into memory.

Tip: Statically linked or static-PIE binaries won’t have an INTERP entry. In those cases there is no dynamic loader involved, which disables techniques that rely on it (e.g., ret2dlresolve).

LOAD

These headers are used to indicate how to load a binary into memory.
Each LOAD header indicates a region of memory (size, permissions and alignment) and indicates the bytes of the ELF binary to copy in there.

For example, the second one has a size of 0x1190, should be located at 0x1fc48 with permissions read and write and will be filled with 0x528 from the offset 0xfc48 (it doesn’t fill all the reserved space). This memory will contain the sections .init_array .fini_array .dynamic .got .data .bss.

DYNAMIC

This header helps to link programs to their library dependencies and apply relocations. Check the .dynamic section.

NOTE

This stores vendor metadata information about the binary.

  • On x86-64, readelf -n will show GNU_PROPERTY_X86_FEATURE_1_* flags inside .note.gnu.property. If you see IBT and/or SHSTK, the binary was built with CET (Indirect Branch Tracking and/or Shadow Stack). This impacts ROP/JOP because indirect branch targets must start with an ENDBR64 instruction and returns are checked against a shadow stack. See the CET page for details and bypass notes.

CET & Shadow Stack

GNU_EH_FRAME

Defines the location of the stack unwind tables, used by debuggers and C++ exception handling-runtime functions.

GNU_STACK

Contains the configuration of the stack execution prevention defense. If enabled, the binary won’t be able to execute code from the stack.

  • Check with readelf -l ./bin | grep GNU_STACK. To forcibly toggle it during tests you can use execstack -s|-c ./bin.

GNU_RELRO

Indicates the RELRO (Relocation Read-Only) configuration of the binary. This protection will mark as read-only certain sections of the memory (like the GOT or the init and fini tables) after the program has loaded and before it begins running.

In the previous example it’s copying 0x3b8 bytes to 0x1fc48 as read-only affecting the sections .init_array .fini_array .dynamic .got .data .bss.

Note that RELRO can be partial or full, the partial version do not protect the section .plt.got, which is used for lazy binding and needs this memory space to have write permissions to write the address of the libraries the first time their location is searched.

For exploitation techniques and up-to-date bypass notes, check the dedicated page:

Relro

TLS

Defines a table of TLS entries, which stores info about thread-local variables.

Section Headers

Section headers gives a more detailed view of the ELF binary

objdump lnstat -h

lnstat:     file format elf64-littleaarch64

Sections:
Idx Name          Size      VMA               LMA               File off  Algn
0 .interp       0000001b  0000000000000238  0000000000000238  00000238  2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
1 .note.gnu.build-id 00000024  0000000000000254  0000000000000254  00000254  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
2 .note.ABI-tag 00000020  0000000000000278  0000000000000278  00000278  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
3 .note.package 0000009c  0000000000000298  0000000000000298  00000298  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
4 .gnu.hash     0000001c  0000000000000338  0000000000000338  00000338  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
5 .dynsym       00000498  0000000000000358  0000000000000358  00000358  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
6 .dynstr       000001fe  00000000000007f0  00000000000007f0  000007f0  2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
7 .gnu.version  00000062  00000000000009ee  00000000000009ee  000009ee  2**1
CONTENTS, ALLOC, LOAD, READONLY, DATA
8 .gnu.version_r 00000050  0000000000000a50  0000000000000a50  00000a50  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
9 .rela.dyn     00000228  0000000000000aa0  0000000000000aa0  00000aa0  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
10 .rela.plt     000003c0  0000000000000cc8  0000000000000cc8  00000cc8  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
11 .init         00000018  0000000000001088  0000000000001088  00001088  2**2
CONTENTS, ALLOC, LOAD, READONLY, CODE
12 .plt          000002a0  00000000000010a0  00000000000010a0  000010a0  2**4
CONTENTS, ALLOC, LOAD, READONLY, CODE
13 .text         00001c34  0000000000001340  0000000000001340  00001340  2**6
CONTENTS, ALLOC, LOAD, READONLY, CODE
14 .fini         00000014  0000000000002f74  0000000000002f74  00002f74  2**2
CONTENTS, ALLOC, LOAD, READONLY, CODE
15 .rodata       00000686  0000000000002f88  0000000000002f88  00002f88  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
16 .eh_frame_hdr 000001b4  0000000000003610  0000000000003610  00003610  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
17 .eh_frame     000007b4  00000000000037c8  00000000000037c8  000037c8  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
18 .init_array   00000008  000000000001fc48  000000000001fc48  0000fc48  2**3
CONTENTS, ALLOC, LOAD, DATA
19 .fini_array   00000008  000000000001fc50  000000000001fc50  0000fc50  2**3
CONTENTS, ALLOC, LOAD, DATA
20 .dynamic      00000200  000000000001fc58  000000000001fc58  0000fc58  2**3
CONTENTS, ALLOC, LOAD, DATA
21 .got          000001a8  000000000001fe58  000000000001fe58  0000fe58  2**3
CONTENTS, ALLOC, LOAD, DATA
22 .data         00000170  0000000000020000  0000000000020000  00010000  2**3
CONTENTS, ALLOC, LOAD, DATA
23 .bss          00000c68  0000000000020170  0000000000020170  00010170  2**3
ALLOC
24 .gnu_debugaltlink 00000049  0000000000000000  0000000000000000  00010170  2**0
CONTENTS, READONLY
25 .gnu_debuglink 00000034  0000000000000000  0000000000000000  000101bc  2**2
CONTENTS, READONLY

Il indique aussi l’emplacement, l’offset, les permissions mais aussi le type de données que contient la section.

Meta Sections

  • String table: Elle contient toutes les chaînes nécessaires au fichier ELF (mais pas celles effectivement utilisées par le programme). Par exemple elle contient des noms de sections comme .text ou .data. Et si .text est à l’offset 45 dans la table des chaînes elle utilisera le nombre 45 dans le name field.
  • In order to find where the string table is, the ELF contains a pointer to the string table.
  • Symbol table: Elle contient des infos sur les symboles comme le name (offset dans la table des chaînes), l’adresse, la taille et d’autres métadonnées sur le symbole.

Main Sections

  • .text: Les instructions du programme à exécuter.
  • .data: Variables globales avec une valeur définie dans le programme.
  • .bss: Variables globales laissées non initialisées (ou initialisées à zéro). Les variables ici sont automatiquement initialisées à zéro, évitant ainsi l’ajout de zéros inutiles dans le binaire.
  • .rodata: Variables globales constantes (section en lecture seule).
  • .tdata et .tbss: Comme .data et .bss lorsque des thread-local variables sont utilisées (__thread_local en C++ ou __thread en C).
  • .dynamic: See below.

Symbols

Un symbole est un emplacement nommé dans le programme qui peut être une fonction, un objet de données global, des thread-local variables…

readelf -s lnstat

Symbol table '.dynsym' contains 49 entries:
Num:    Value          Size Type    Bind   Vis      Ndx Name
0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND
1: 0000000000001088     0 SECTION LOCAL  DEFAULT   12 .init
2: 0000000000020000     0 SECTION LOCAL  DEFAULT   23 .data
3: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND strtok@GLIBC_2.17 (2)
4: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND strlen@GLIBC_2.17 (2)
6: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND fputs@GLIBC_2.17 (2)
7: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND exit@GLIBC_2.17 (2)
8: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND perror@GLIBC_2.17 (2)
10: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND _ITM_deregisterT[...]
11: 0000000000000000     0 FUNC    WEAK   DEFAULT  UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND putc@GLIBC_2.17 (2)
[...]

Chaque entrée de symbole contient :

  • Nom
  • Attributs de liaison (weak, local or global) : Un symbole local ne peut être accédé que par le programme lui‑même tandis que les symboles globaux sont partagés en dehors du programme. Un objet weak est, par exemple, une fonction qui peut être remplacée par une autre.
  • Type : NOTYPE (aucun type spécifié), OBJECT (variable de données globale), FUNC (fonction), SECTION (section), FILE (fichier source pour les débogueurs), TLS (variable locale au thread), GNU_IFUNC (fonction indirecte pour la relocation)
  • Section : index de la section où il se trouve
  • Valeur (adresse en mémoire)
  • Taille

GNU IFUNC (fonctions indirectes)

  • GCC peut émettre des symboles STT_GNU_IFUNC avec l’extension __attribute__((ifunc("resolver"))). Le chargeur dynamique appelle le résolveur au chargement pour sélectionner l’implémentation concrète (généralement un dispatch selon le CPU).
  • Triage rapide : readelf -sW ./bin | rg -i "IFUNC"

Versionnage des symboles GNU (dynsym/dynstr/gnu.version)

La glibc moderne utilise des versions de symboles. Vous verrez des entrées dans .gnu.version et .gnu.version_r ainsi que des noms de symboles comme strlen@GLIBC_2.17. L’éditeur de liens dynamique peut exiger une version spécifique lors de la résolution d’un symbole. Lors de la création de relocations manuelles (par ex. ret2dlresolve) vous devez fournir l’index de version correct, sinon la résolution échoue.

Section dynamique

readelf -d lnstat

Dynamic section at offset 0xfc58 contains 28 entries:
Tag        Type                         Name/Value
0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]
0x0000000000000001 (NEEDED)             Shared library: [ld-linux-aarch64.so.1]
0x000000000000000c (INIT)               0x1088
0x000000000000000d (FINI)               0x2f74
0x0000000000000019 (INIT_ARRAY)         0x1fc48
0x000000000000001b (INIT_ARRAYSZ)       8 (bytes)
0x000000000000001a (FINI_ARRAY)         0x1fc50
0x000000000000001c (FINI_ARRAYSZ)       8 (bytes)
0x000000006ffffef5 (GNU_HASH)           0x338
0x0000000000000005 (STRTAB)             0x7f0
0x0000000000000006 (SYMTAB)             0x358
0x000000000000000a (STRSZ)              510 (bytes)
0x000000000000000b (SYMENT)             24 (bytes)
0x0000000000000015 (DEBUG)              0x0
0x0000000000000003 (PLTGOT)             0x1fe58
0x0000000000000002 (PLTRELSZ)           960 (bytes)
0x0000000000000014 (PLTREL)             RELA
0x0000000000000017 (JMPREL)             0xcc8
0x0000000000000007 (RELA)               0xaa0
0x0000000000000008 (RELASZ)             552 (bytes)
0x0000000000000009 (RELAENT)            24 (bytes)
0x000000000000001e (FLAGS)              BIND_NOW
0x000000006ffffffb (FLAGS_1)            Flags: NOW PIE
0x000000006ffffffe (VERNEED)            0xa50
0x000000006fffffff (VERNEEDNUM)         2
0x000000006ffffff0 (VERSYM)             0x9ee
0x000000006ffffff9 (RELACOUNT)          15
0x0000000000000000 (NULL)               0x0

La section NEEDED indique que le programme doit charger la bibliothèque mentionnée pour pouvoir continuer. La section NEEDED est considérée complète une fois que la bibliothèque partagée est pleinement opérationnelle et prête à l’emploi.

Ordre de recherche du chargeur dynamique (RPATH/RUNPATH, $ORIGIN)

Les entrées DT_RPATH (deprecated) et/ou DT_RUNPATH influencent l’endroit où le chargeur dynamique recherche les dépendances. Ordre approximatif :

  • LD_LIBRARY_PATH (ignoré pour les programmes setuid/sgid ou en contexte “secure-execution”)
  • DT_RPATH (uniquement si DT_RUNPATH est absent)
  • DT_RUNPATH
  • ld.so.cache
  • répertoires par défaut comme /lib64, /usr/lib64, etc.

$ORIGIN peut être utilisé dans RPATH/RUNPATH pour faire référence au répertoire de l’objet principal. Du point de vue d’un attaquant, cela importe lorsque vous contrôlez la disposition du système de fichiers ou l’environnement. Pour les binaires durcis (AT_SECURE), la plupart des variables d’environnement sont ignorées par le chargeur.

  • Inspecter avec : readelf -d ./bin | egrep -i 'r(path|unpath)'
  • Test rapide : LD_DEBUG=libs ./bin 2>&1 | grep -i find (affiche les décisions de recherche)

Priv-esc tip: Préférez abuser des RUNPATHs écrivables ou des chemins relatifs à $ORIGIN mal configurés et vous appartenant. LD_PRELOAD/LD_AUDIT sont ignorés en contexte secure-execution (setuid).

Relocations

Le chargeur doit aussi effectuer les relocations des dépendances après les avoir chargées. Ces relocations sont indiquées dans la relocation table aux formats REL ou RELA et le nombre de relocations est donné dans les sections dynamiques RELSZ ou RELASZ.

readelf -r lnstat

Relocation section '.rela.dyn' at offset 0xaa0 contains 23 entries:
Offset          Info           Type           Sym. Value    Sym. Name + Addend
00000001fc48  000000000403 R_AARCH64_RELATIV                    1d10
00000001fc50  000000000403 R_AARCH64_RELATIV                    1cc0
00000001fff0  000000000403 R_AARCH64_RELATIV                    1340
000000020008  000000000403 R_AARCH64_RELATIV                    20008
000000020010  000000000403 R_AARCH64_RELATIV                    3330
000000020030  000000000403 R_AARCH64_RELATIV                    3338
000000020050  000000000403 R_AARCH64_RELATIV                    3340
000000020070  000000000403 R_AARCH64_RELATIV                    3348
000000020090  000000000403 R_AARCH64_RELATIV                    3350
0000000200b0  000000000403 R_AARCH64_RELATIV                    3358
0000000200d0  000000000403 R_AARCH64_RELATIV                    3360
0000000200f0  000000000403 R_AARCH64_RELATIV                    3370
000000020110  000000000403 R_AARCH64_RELATIV                    3378
000000020130  000000000403 R_AARCH64_RELATIV                    3380
000000020150  000000000403 R_AARCH64_RELATIV                    3388
00000001ffb8  000a00000401 R_AARCH64_GLOB_DA 0000000000000000 _ITM_deregisterTM[...] + 0
00000001ffc0  000b00000401 R_AARCH64_GLOB_DA 0000000000000000 __cxa_finalize@GLIBC_2.17 + 0
00000001ffc8  000f00000401 R_AARCH64_GLOB_DA 0000000000000000 stderr@GLIBC_2.17 + 0
00000001ffd0  001000000401 R_AARCH64_GLOB_DA 0000000000000000 optarg@GLIBC_2.17 + 0
00000001ffd8  001400000401 R_AARCH64_GLOB_DA 0000000000000000 stdout@GLIBC_2.17 + 0
00000001ffe0  001e00000401 R_AARCH64_GLOB_DA 0000000000000000 __gmon_start__ + 0
00000001ffe8  001f00000401 R_AARCH64_GLOB_DA 0000000000000000 __stack_chk_guard@GLIBC_2.17 + 0
00000001fff8  002e00000401 R_AARCH64_GLOB_DA 0000000000000000 _ITM_registerTMCl[...] + 0

Relocation section '.rela.plt' at offset 0xcc8 contains 40 entries:
Offset          Info           Type           Sym. Value    Sym. Name + Addend
00000001fe70  000300000402 R_AARCH64_JUMP_SL 0000000000000000 strtok@GLIBC_2.17 + 0
00000001fe78  000400000402 R_AARCH64_JUMP_SL 0000000000000000 strtoul@GLIBC_2.17 + 0
00000001fe80  000500000402 R_AARCH64_JUMP_SL 0000000000000000 strlen@GLIBC_2.17 + 0
00000001fe88  000600000402 R_AARCH64_JUMP_SL 0000000000000000 fputs@GLIBC_2.17 + 0
00000001fe90  000700000402 R_AARCH64_JUMP_SL 0000000000000000 exit@GLIBC_2.17 + 0
00000001fe98  000800000402 R_AARCH64_JUMP_SL 0000000000000000 __libc_start_main@GLIBC_2.34 + 0
00000001fea0  000900000402 R_AARCH64_JUMP_SL 0000000000000000 perror@GLIBC_2.17 + 0
00000001fea8  000b00000402 R_AARCH64_JUMP_SL 0000000000000000 __cxa_finalize@GLIBC_2.17 + 0
00000001feb0  000c00000402 R_AARCH64_JUMP_SL 0000000000000000 putc@GLIBC_2.17 + 0
00000001fec0  000e00000402 R_AARCH64_JUMP_SL 0000000000000000 fputc@GLIBC_2.17 + 0
00000001fec8  001100000402 R_AARCH64_JUMP_SL 0000000000000000 snprintf@GLIBC_2.17 + 0
00000001fed0  001200000402 R_AARCH64_JUMP_SL 0000000000000000 __snprintf_chk@GLIBC_2.17 + 0
00000001fed8  001300000402 R_AARCH64_JUMP_SL 0000000000000000 malloc@GLIBC_2.17 + 0
00000001fee0  001500000402 R_AARCH64_JUMP_SL 0000000000000000 gettimeofday@GLIBC_2.17 + 0
00000001fee8  001600000402 R_AARCH64_JUMP_SL 0000000000000000 sleep@GLIBC_2.17 + 0
00000001fef0  001700000402 R_AARCH64_JUMP_SL 0000000000000000 __vfprintf_chk@GLIBC_2.17 + 0
00000001fef8  001800000402 R_AARCH64_JUMP_SL 0000000000000000 calloc@GLIBC_2.17 + 0
00000001ff00  001900000402 R_AARCH64_JUMP_SL 0000000000000000 rewind@GLIBC_2.17 + 0
00000001ff08  001a00000402 R_AARCH64_JUMP_SL 0000000000000000 strdup@GLIBC_2.17 + 0
00000001ff10  001b00000402 R_AARCH64_JUMP_SL 0000000000000000 closedir@GLIBC_2.17 + 0
00000001ff18  001c00000402 R_AARCH64_JUMP_SL 0000000000000000 __stack_chk_fail@GLIBC_2.17 + 0
00000001ff20  001d00000402 R_AARCH64_JUMP_SL 0000000000000000 strrchr@GLIBC_2.17 + 0
00000001ff28  001e00000402 R_AARCH64_JUMP_SL 0000000000000000 __gmon_start__ + 0
00000001ff30  002000000402 R_AARCH64_JUMP_SL 0000000000000000 abort@GLIBC_2.17 + 0
00000001ff38  002100000402 R_AARCH64_JUMP_SL 0000000000000000 feof@GLIBC_2.17 + 0
00000001ff40  002200000402 R_AARCH64_JUMP_SL 0000000000000000 getopt_long@GLIBC_2.17 + 0
00000001ff48  002300000402 R_AARCH64_JUMP_SL 0000000000000000 __fprintf_chk@GLIBC_2.17 + 0
00000001ff50  002400000402 R_AARCH64_JUMP_SL 0000000000000000 strcmp@GLIBC_2.17 + 0
00000001ff58  002500000402 R_AARCH64_JUMP_SL 0000000000000000 free@GLIBC_2.17 + 0
00000001ff60  002600000402 R_AARCH64_JUMP_SL 0000000000000000 readdir64@GLIBC_2.17 + 0
00000001ff68  002700000402 R_AARCH64_JUMP_SL 0000000000000000 strndup@GLIBC_2.17 + 0
00000001ff70  002800000402 R_AARCH64_JUMP_SL 0000000000000000 strchr@GLIBC_2.17 + 0
00000001ff78  002900000402 R_AARCH64_JUMP_SL 0000000000000000 fwrite@GLIBC_2.17 + 0
00000001ff80  002a00000402 R_AARCH64_JUMP_SL 0000000000000000 fflush@GLIBC_2.17 + 0
00000001ff88  002b00000402 R_AARCH64_JUMP_SL 0000000000000000 fopen64@GLIBC_2.17 + 0
00000001ff90  002c00000402 R_AARCH64_JUMP_SL 0000000000000000 __isoc99_sscanf@GLIBC_2.17 + 0
00000001ff98  002d00000402 R_AARCH64_JUMP_SL 0000000000000000 strncpy@GLIBC_2.17 + 0
00000001ffa0  002f00000402 R_AARCH64_JUMP_SL 0000000000000000 __assert_fail@GLIBC_2.17 + 0
00000001ffa8  003000000402 R_AARCH64_JUMP_SL 0000000000000000 fgets@GLIBC_2.17 + 0

Relocalisations relatives compactées (RELR)

  • Les linkers modernes peuvent émettre des relocalisations relatives compactes avec -z pack-relative-relocs. Cela ajoute des entrées DT_RELR, DT_RELRSZ, et DT_RELRENT à la section dynamique pour les PIEs/shared libraries (cette option est ignorée pour les exécutables non-PIE).
  • Recon: readelf -d ./bin | egrep -i "DT_RELR|RELRSZ|RELRENT"

Relocalisations statiques

Si le programme est chargé à une adresse différente de l’adresse préférée (habituellement 0x400000) parce que l’adresse est déjà utilisée ou à cause de ASLR ou pour toute autre raison, une relocalisation statique corrige les pointeurs qui avaient des valeurs en supposant que le binaire serait chargé à l’adresse préférée.

Par exemple, toute section de type R_AARCH64_RELATIV devrait avoir modifié l’adresse à (relocation bias + addend).

Relocalisations dynamiques et GOT

La relocalisation peut aussi référencer un symbole externe (comme une fonction d’une dépendance). Par exemple la fonction malloc de libC. Ensuite, lorsque le loader charge libC à une adresse, il vérifie où la fonction malloc est chargée et écrit cette adresse dans la table GOT (Global Offset Table) indiquée dans la table de relocations, là où l’adresse de malloc doit être spécifiée.

Procedure Linkage Table

La section PLT permet d’effectuer du lazy binding, ce qui signifie que la résolution de l’emplacement d’une fonction est effectuée la première fois qu’elle est appelée.

Donc lorsqu’un programme appelle malloc, il appelle en réalité l’emplacement correspondant de malloc dans la PLT (malloc@plt). La première fois qu’il est appelé, l’adresse de malloc est résolue et stockée, de sorte que la fois suivante l’appel à malloc utilise cette adresse au lieu du code PLT.

Modern linking behaviors that impact exploitation

  • -z now (Full RELRO) désactive le lazy binding ; les entrées PLT existent toujours mais GOT/PLT est mappé en lecture seule, donc des techniques comme GOT overwrite et ret2dlresolve ne fonctionneront pas contre le binaire principal (les bibliothèques peuvent encore être partiellement RELRO). See:

Relro

  • -fno-plt force le compilateur à appeler les fonctions externes via l’entrée GOT directement au lieu de passer par le stub PLT. Vous verrez des séquences d’appels comme mov reg, [got]; call reg au lieu de call func@plt. Cela réduit les abus de speculative-execution et change légèrement la chasse aux gadgets ROP autour des stubs PLT.

  • PIE vs static-PIE : PIE (ET_DYN with INTERP) nécessite le dynamic loader et supporte la mécanique PLT/GOT habituelle. Static-PIE (ET_DYN without INTERP) a les relocations appliquées par le kernel loader et pas de ld.so ; attendez-vous à aucune résolution PLT à l’exécution.

Si GOT/PLT n’est pas une option, pivotez vers d’autres pointeurs de code modifiables ou utilisez le ROP/SROP classique vers libc.

WWW2Exec - GOT/PLT

Initialisation du programme

Après que le programme a été chargé, il est temps qu’il s’exécute. Cependant, le premier code qui s’exécute n’est pas toujours la main. C’est parce que par exemple en C++ si une variable globale est un objet d’une classe, cet objet doit être initialisé avant que main s’exécute, comme dans :

#include <stdio.h>
// g++ autoinit.cpp -o autoinit
class AutoInit {
public:
AutoInit() {
printf("Hello AutoInit!\n");
}
~AutoInit() {
printf("Goodbye AutoInit!\n");
}
};

AutoInit autoInit;

int main() {
printf("Main\n");
return 0;
}

Notez que ces variables globales se trouvent dans .data ou .bss, mais dans les listes __CTOR_LIST__ et __DTOR_LIST__ les objets à initialiser et à détruire sont stockés afin d’en garder la trace.

Dans du code C, il est possible d’obtenir le même résultat en utilisant les extensions GNU :

__attribute__((constructor)) //Add a constructor to execute before
__attribute__((destructor)) //Add to the destructor list

Du point de vue du compilateur, pour exécuter ces actions avant et après l’exécution de la fonction main, il est possible de créer une fonction init et une fonction fini qui seraient référencées dans la section dynamique en tant que INIT et FINI, et sont placées dans les sections init et fini de l’ELF.

L’autre option, comme mentionné, est de référencer les listes __CTOR_LIST__ et __DTOR_LIST__ dans les entrées INIT_ARRAY et FINI_ARRAY de la section dynamique ; leur longueur est indiquée par INIT_ARRAYSZ et FINI_ARRAYSZ. Chaque entrée est un pointeur de fonction qui sera appelé sans arguments.

De plus, il est aussi possible d’avoir un PREINIT_ARRAY avec des pointeurs qui seront exécutés avant les pointeurs de INIT_ARRAY.

Note d’exploitation

  • Sous Partial RELRO, ces tableaux résident dans des pages encore modifiables avant que ld.so ne passe PT_GNU_RELRO en lecture seule. Si vous obtenez une écriture arbitraire assez tôt ou si vous pouvez cibler les tableaux modifiables d’une librairie, vous pouvez détourner le flux de contrôle en écrasant une entrée par une fonction de votre choix. Sous Full RELRO, ils sont en lecture seule à l’exécution.

  • Pour l’abus de lazy binding du dynamic linker afin de résoudre des symboles arbitraires à l’exécution, consultez la page dédiée :

Ret2dlresolve

Ordre d’initialisation

  1. Le programme est chargé en mémoire, les variables globales statiques sont initialisées dans .data et celles non initialisées sont mises à zéro dans .bss.
  2. Toutes les dépendances du programme ou des bibliothèques sont initialisées et la liaison dynamique est effectuée.
  3. Les fonctions PREINIT_ARRAY sont exécutées.
  4. Les fonctions INIT_ARRAY sont exécutées.
  5. S’il existe une entrée INIT, elle est appelée.
  6. Si c’est une bibliothèque, dlopen se termine ici ; si c’est un programme, il est temps d’appeler le vrai point d’entrée (fonction main).

Thread-Local Storage (TLS)

Ils sont définis en utilisant le mot-clé __thread_local en C++ ou l’extension GNU __thread.

Chaque thread disposera d’un emplacement unique pour cette variable, de sorte que seul le thread peut accéder à sa variable.

Quand cela est utilisé, les sections .tdata et .tbss sont utilisées dans l’ELF. Elles sont similaires à .data (initialisée) et .bss (non initialisée) mais pour le TLS.

Chaque variable aura une entrée dans l’en-tête TLS spécifiant la taille et l’offset TLS, qui est l’offset qu’elle utilisera dans la zone de données locale du thread.

Le symbole __TLS_MODULE_BASE est utilisé pour référer à l’adresse de base du thread local storage et pointe vers la zone mémoire contenant toutes les données thread-local d’un module.

Vecteur auxiliaire (auxv) et vDSO

Le noyau Linux fournit un vecteur auxiliaire (auxv) aux processus contenant des adresses et des drapeaux utiles pour l’exécution :

  • AT_RANDOM : pointe vers 16 octets aléatoires utilisés par glibc pour le stack canary et d’autres graines du PRNG.
  • AT_SYSINFO_EHDR : adresse de base du mapping vDSO (pratique pour trouver les syscalls __kernel_* et gadgets).
  • AT_EXECFN, AT_BASE, AT_PAGESZ, etc.

En tant qu’attaquant, si vous pouvez lire la mémoire ou des fichiers sous /proc, vous pouvez souvent leak ces informations sans un infoleak dans le processus ciblé :

# Show the auxv of a running process
cat /proc/$(pidof target)/auxv | xxd

# From your own process (helper snippet)
#include <sys/auxv.h>
#include <stdio.h>
int main(){
printf("AT_RANDOM=%p\n", (void*)getauxval(AT_RANDOM));
printf("AT_SYSINFO_EHDR=%p\n", (void*)getauxval(AT_SYSINFO_EHDR));
}

Leaking AT_RANDOM vous donne la valeur du canary si vous pouvez déréférencer ce pointeur ; AT_SYSINFO_EHDR vous donne une base vDSO pour rechercher des gadgets ou appeler directement des fast syscalls.

References

  • Attributs de fonction communs de GCC (ifunc / STT_GNU_IFUNC): https://gcc.gnu.org/onlinedocs/gcc-14.3.0/gcc/Common-Function-Attributes.html
  • GNU ld -z pack-relative-relocs / DT_RELR documentation: https://sourceware.org/binutils/docs/ld.html
  • ld.so(8) – ordre de recherche du loader dynamique, RPATH/RUNPATH, règles d’exécution sécurisée (AT_SECURE): https://man7.org/linux/man-pages/man8/ld.so.8.html
  • getauxval(3) – vecteur auxiliaire et constantes AT_*: https://man7.org/linux/man-pages/man3/getauxval.3.html

Tip

Apprenez et pratiquez le hacking AWS :HackTricks Training AWS Red Team Expert (ARTE)
Apprenez et pratiquez le hacking GCP : HackTricks Training GCP Red Team Expert (GRTE) Apprenez et pratiquez le hacking Azure : HackTricks Training Azure Red Team Expert (AzRTE)

Soutenir HackTricks