Informazioni di base su ELF

Tip

Impara e pratica il hacking AWS:HackTricks Training AWS Red Team Expert (ARTE)
Impara e pratica il hacking GCP: HackTricks Training GCP Red Team Expert (GRTE) Impara e pratica il hacking Azure: HackTricks Training Azure Red Team Expert (AzRTE)

Supporta HackTricks

Intestazioni del programma

Descrivono al loader come caricare l’ELF in memoria:

readelf -lW lnstat

Elf file type is DYN (Position-Independent Executable file)
Entry point 0x1c00
There are 9 program headers, starting at offset 64

Program Headers:
Type           Offset   VirtAddr           PhysAddr           FileSiz  MemSiz   Flg Align
PHDR           0x000040 0x0000000000000040 0x0000000000000040 0x0001f8 0x0001f8 R   0x8
INTERP         0x000238 0x0000000000000238 0x0000000000000238 0x00001b 0x00001b R   0x1
[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]
LOAD           0x000000 0x0000000000000000 0x0000000000000000 0x003f7c 0x003f7c R E 0x10000
LOAD           0x00fc48 0x000000000001fc48 0x000000000001fc48 0x000528 0x001190 RW  0x10000
DYNAMIC        0x00fc58 0x000000000001fc58 0x000000000001fc58 0x000200 0x000200 RW  0x8
NOTE           0x000254 0x0000000000000254 0x0000000000000254 0x0000e0 0x0000e0 R   0x4
GNU_EH_FRAME   0x003610 0x0000000000003610 0x0000000000003610 0x0001b4 0x0001b4 R   0x4
GNU_STACK      0x000000 0x0000000000000000 0x0000000000000000 0x000000 0x000000 RW  0x10
GNU_RELRO      0x00fc48 0x000000000001fc48 0x000000000001fc48 0x0003b8 0x0003b8 R   0x1

Section to Segment mapping:
Segment Sections...
00
01     .interp
02     .interp .note.gnu.build-id .note.ABI-tag .note.package .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
03     .init_array .fini_array .dynamic .got .data .bss
04     .dynamic
05     .note.gnu.build-id .note.ABI-tag .note.package
06     .eh_frame_hdr
07
08     .init_array .fini_array .dynamic .got

Il programma precedente ha 9 program headers, quindi la segment mapping indica in quale program header (da 00 a 08) si trova ogni sezione.

PHDR - Program HeaDeR

Contiene le tabelle dei program header e i metadati.

INTERP

Indica il percorso del loader da usare per caricare il binary in memoria.

Tip: I binari statically linked o static-PIE non avranno una voce INTERP. In questi casi non è coinvolto alcun dynamic loader, il che disabilita tecniche che si basano su di esso (es. ret2dlresolve).

LOAD

Questi header sono usati per indicare come caricare un binary in memoria.
Ogni LOAD header indica una regione di memory (dimensione, permessi e allineamento) e specifica i byte dell’ELF da copiare lì.

Per esempio, il secondo ha una size di 0x1190, dovrebbe essere collocato a 0x1fc48 con permessi read e write e sarà riempito con 0x528 dall’offset 0xfc48 (non riempie tutto lo spazio riservato). Questa memory conterrà le sezioni .init_array .fini_array .dynamic .got .data .bss.

DYNAMIC

Questo header aiuta a collegare i programmi alle loro dipendenze di libreria e ad applicare le relocations. Controlla la sezione .dynamic.

NOTE

Questo memorizza informazioni di metadata del vendor sul binary.

  • Su x86-64, readelf -n mostrerà i flag GNU_PROPERTY_X86_FEATURE_1_* dentro .note.gnu.property. Se vedi IBT e/o SHSTK, il binary è stato compilato con CET (Indirect Branch Tracking e/o Shadow Stack). Questo impatta ROP/JOP perché gli indirect branch targets devono cominciare con un’istruzione ENDBR64 e i return vengono verificati contro una shadow stack. Vedi la pagina CET per dettagli e note sui bypass.

CET & Shadow Stack

GNU_EH_FRAME

Definisce la posizione delle tabelle di stack unwind, usate da debugger e dalle funzioni di runtime di exception handling di C++.

GNU_STACK

Contiene la configurazione della difesa di prevenzione dell’esecuzione sulla stack. Se abilitato, il binary non potrà eseguire codice dallo stack.

  • Verifica con readelf -l ./bin | grep GNU_STACK. Per forzare il toggle durante i test puoi usare execstack -s|-c ./bin.

GNU_RELRO

Indica la configurazione RELRO (Relocation Read-Only) del binary. Questa protezione marcherà come read-only certe sezioni della memory (come la GOT o le tabelle init e fini) dopo che il programma è stato caricato e prima che inizi l’esecuzione.

Nell’esempio precedente sta copiando 0x3b8 byte a 0x1fc48 come read-only influenzando le sezioni .init_array .fini_array .dynamic .got .data .bss.

Nota che RELRO può essere partial o full: la versione partial non protegge la sezione .plt.got, che è usata per il lazy binding e necessita che questo spazio di memory abbia write permissions per scrivere l’indirizzo delle librerie la prima volta che la loro posizione viene risolta.

Per tecniche di exploitation e note di bypass aggiornate, consulta la pagina dedicata:

Relro

TLS

Definisce una tabella di TLS entries, che memorizza info sulle thread-local variables.

Section Headers

I Section Headers forniscono una vista più dettagliata del binary ELF

objdump lnstat -h

lnstat:     file format elf64-littleaarch64

Sections:
Idx Name          Size      VMA               LMA               File off  Algn
0 .interp       0000001b  0000000000000238  0000000000000238  00000238  2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
1 .note.gnu.build-id 00000024  0000000000000254  0000000000000254  00000254  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
2 .note.ABI-tag 00000020  0000000000000278  0000000000000278  00000278  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
3 .note.package 0000009c  0000000000000298  0000000000000298  00000298  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
4 .gnu.hash     0000001c  0000000000000338  0000000000000338  00000338  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
5 .dynsym       00000498  0000000000000358  0000000000000358  00000358  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
6 .dynstr       000001fe  00000000000007f0  00000000000007f0  000007f0  2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
7 .gnu.version  00000062  00000000000009ee  00000000000009ee  000009ee  2**1
CONTENTS, ALLOC, LOAD, READONLY, DATA
8 .gnu.version_r 00000050  0000000000000a50  0000000000000a50  00000a50  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
9 .rela.dyn     00000228  0000000000000aa0  0000000000000aa0  00000aa0  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
10 .rela.plt     000003c0  0000000000000cc8  0000000000000cc8  00000cc8  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
11 .init         00000018  0000000000001088  0000000000001088  00001088  2**2
CONTENTS, ALLOC, LOAD, READONLY, CODE
12 .plt          000002a0  00000000000010a0  00000000000010a0  000010a0  2**4
CONTENTS, ALLOC, LOAD, READONLY, CODE
13 .text         00001c34  0000000000001340  0000000000001340  00001340  2**6
CONTENTS, ALLOC, LOAD, READONLY, CODE
14 .fini         00000014  0000000000002f74  0000000000002f74  00002f74  2**2
CONTENTS, ALLOC, LOAD, READONLY, CODE
15 .rodata       00000686  0000000000002f88  0000000000002f88  00002f88  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
16 .eh_frame_hdr 000001b4  0000000000003610  0000000000003610  00003610  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
17 .eh_frame     000007b4  00000000000037c8  00000000000037c8  000037c8  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
18 .init_array   00000008  000000000001fc48  000000000001fc48  0000fc48  2**3
CONTENTS, ALLOC, LOAD, DATA
19 .fini_array   00000008  000000000001fc50  000000000001fc50  0000fc50  2**3
CONTENTS, ALLOC, LOAD, DATA
20 .dynamic      00000200  000000000001fc58  000000000001fc58  0000fc58  2**3
CONTENTS, ALLOC, LOAD, DATA
21 .got          000001a8  000000000001fe58  000000000001fe58  0000fe58  2**3
CONTENTS, ALLOC, LOAD, DATA
22 .data         00000170  0000000000020000  0000000000020000  00010000  2**3
CONTENTS, ALLOC, LOAD, DATA
23 .bss          00000c68  0000000000020170  0000000000020170  00010170  2**3
ALLOC
24 .gnu_debugaltlink 00000049  0000000000000000  0000000000000000  00010170  2**0
CONTENTS, READONLY
25 .gnu_debuglink 00000034  0000000000000000  0000000000000000  000101bc  2**2
CONTENTS, READONLY

Indica anche la posizione, l’offset, i permessi ma anche il tipo di dati contenuti nella sezione.

Sezioni meta

  • Tabella delle stringhe: Contiene tutte le stringhe necessarie al file ELF (ma non quelle effettivamente usate dal programma). Per esempio contiene i nomi delle sezioni come .text o .data. E se .text si trova all’offset 45 nella tabella delle stringhe userà il numero 45 nel campo name.
  • Per trovare dove si trova la tabella delle stringhe, l’ELF contiene un puntatore alla tabella delle stringhe.
  • Tabella dei simboli: Contiene informazioni sui simboli come il nome (offset nella tabella delle stringhe), l’indirizzo, la dimensione e altri metadati sul simbolo.

Sezioni principali

  • .text: Le istruzioni del programma da eseguire.
  • .data: Variabili globali con un valore definito nel programma.
  • .bss: Variabili globali lasciate non inizializzate (o inizializzate a zero). Le variabili qui vengono automaticamente inizializzate a zero evitando che inutili zeri vengano aggiunti al binario.
  • .rodata: Variabili globali costanti (sezione in sola lettura).
  • .tdata e .tbss: Come .data e .bss quando vengono usate variabili thread-local (__thread_local in C++ o __thread in C).
  • .dynamic: Vedi sotto.

Simboli

I simboli sono posizioni nominate nel programma che possono essere una funzione, un oggetto dati globale, variabili thread-local…

readelf -s lnstat

Symbol table '.dynsym' contains 49 entries:
Num:    Value          Size Type    Bind   Vis      Ndx Name
0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND
1: 0000000000001088     0 SECTION LOCAL  DEFAULT   12 .init
2: 0000000000020000     0 SECTION LOCAL  DEFAULT   23 .data
3: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND strtok@GLIBC_2.17 (2)
4: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND strlen@GLIBC_2.17 (2)
6: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND fputs@GLIBC_2.17 (2)
7: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND exit@GLIBC_2.17 (2)
8: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND perror@GLIBC_2.17 (2)
10: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND _ITM_deregisterT[...]
11: 0000000000000000     0 FUNC    WEAK   DEFAULT  UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND putc@GLIBC_2.17 (2)
[...]

Ogni voce di simbolo contiene:

  • Name
  • Binding attributes (weak, local or global): Un simbolo local può essere accessibile solo dal programma stesso mentre i simboli global sono condivisi all’esterno del programma. Un oggetto weak è, per esempio, una funzione che può essere sovrascritta da una diversa.
  • Type: NOTYPE (nessun tipo specificato), OBJECT (variabile dati globale), FUNC (funzione), SECTION (sezione), FILE (file sorgente per i debugger), TLS (variabile thread-local), GNU_IFUNC (funzione indiretta per la relocation)
  • Section index where it’s located
  • Value (indirizzo in memoria)
  • Size

GNU IFUNC (funzioni indirette)

  • GCC può emettere simboli STT_GNU_IFUNC con l’estensione __attribute__((ifunc("resolver"))). Il loader dinamico chiama il resolver al momento del caricamento per selezionare l’implementazione concreta (comunemente dispatch per CPU).
  • Verifica rapida: readelf -sW ./bin | rg -i "IFUNC"

GNU Symbol Versioning (dynsym/dynstr/gnu.version)

La glibc moderna usa versioni dei simboli. Vedrai voci in .gnu.version e .gnu.version_r e nomi di simboli come strlen@GLIBC_2.17. Il linker dinamico può richiedere una versione specifica durante la risoluzione di un simbolo. Quando costruisci relocations manuali (es. ret2dlresolve) devi fornire l’indice di versione corretto, altrimenti la risoluzione fallisce.

Sezione dinamica

readelf -d lnstat

Dynamic section at offset 0xfc58 contains 28 entries:
Tag        Type                         Name/Value
0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]
0x0000000000000001 (NEEDED)             Shared library: [ld-linux-aarch64.so.1]
0x000000000000000c (INIT)               0x1088
0x000000000000000d (FINI)               0x2f74
0x0000000000000019 (INIT_ARRAY)         0x1fc48
0x000000000000001b (INIT_ARRAYSZ)       8 (bytes)
0x000000000000001a (FINI_ARRAY)         0x1fc50
0x000000000000001c (FINI_ARRAYSZ)       8 (bytes)
0x000000006ffffef5 (GNU_HASH)           0x338
0x0000000000000005 (STRTAB)             0x7f0
0x0000000000000006 (SYMTAB)             0x358
0x000000000000000a (STRSZ)              510 (bytes)
0x000000000000000b (SYMENT)             24 (bytes)
0x0000000000000015 (DEBUG)              0x0
0x0000000000000003 (PLTGOT)             0x1fe58
0x0000000000000002 (PLTRELSZ)           960 (bytes)
0x0000000000000014 (PLTREL)             RELA
0x0000000000000017 (JMPREL)             0xcc8
0x0000000000000007 (RELA)               0xaa0
0x0000000000000008 (RELASZ)             552 (bytes)
0x0000000000000009 (RELAENT)            24 (bytes)
0x000000000000001e (FLAGS)              BIND_NOW
0x000000006ffffffb (FLAGS_1)            Flags: NOW PIE
0x000000006ffffffe (VERNEED)            0xa50
0x000000006fffffff (VERNEEDNUM)         2
0x000000006ffffff0 (VERSYM)             0x9ee
0x000000006ffffff9 (RELACOUNT)          15
0x0000000000000000 (NULL)               0x0

La directory NEEDED indica che il programma deve caricare la libreria menzionata per poter continuare. La directory NEEDED si considera completata una volta che la libreria condivisa è completamente operativa e pronta per l’uso.

Dynamic loader search order (RPATH/RUNPATH, $ORIGIN)

Le voci DT_RPATH (deprecata) e/o DT_RUNPATH influenzano dove il loader dinamico cerca le dipendenze. Ordine approssimativo:

  • LD_LIBRARY_PATH (ignorata per programmi setuid/sgid o comunque in “secure-execution”)
  • DT_RPATH (solo se DT_RUNPATH assente)
  • DT_RUNPATH
  • ld.so.cache
  • directory predefinite come /lib64, /usr/lib64, ecc.

$ORIGIN può essere usato dentro RPATH/RUNPATH per riferirsi alla directory dell’oggetto principale. Dal punto di vista di un attaccante questo è rilevante quando si controlla il layout del filesystem o l’ambiente. Per i binari hardenizzati (AT_SECURE) la maggior parte delle variabili d’ambiente viene ignorata dal loader.

  • Ispeziona con: readelf -d ./bin | egrep -i 'r(path|unpath)'
  • Test rapido: LD_DEBUG=libs ./bin 2>&1 | grep -i find (mostra come vengono scelte le directory di ricerca)

Priv-esc tip: È preferibile abusare di RUNPATH scrivibili o di percorsi relativi a $ORIGIN mal configurati e di cui sei proprietario. LD_PRELOAD/LD_AUDIT vengono ignorati in contesti secure-execution (setuid).

Relocations

Il loader deve inoltre eseguire le relocation delle dipendenze dopo averle caricate. Queste relocation sono indicate nella relocation table nei formati REL o RELA e il numero di relocation è dato nelle sezioni dinamiche RELSZ o RELASZ.

readelf -r lnstat

Relocation section '.rela.dyn' at offset 0xaa0 contains 23 entries:
Offset          Info           Type           Sym. Value    Sym. Name + Addend
00000001fc48  000000000403 R_AARCH64_RELATIV                    1d10
00000001fc50  000000000403 R_AARCH64_RELATIV                    1cc0
00000001fff0  000000000403 R_AARCH64_RELATIV                    1340
000000020008  000000000403 R_AARCH64_RELATIV                    20008
000000020010  000000000403 R_AARCH64_RELATIV                    3330
000000020030  000000000403 R_AARCH64_RELATIV                    3338
000000020050  000000000403 R_AARCH64_RELATIV                    3340
000000020070  000000000403 R_AARCH64_RELATIV                    3348
000000020090  000000000403 R_AARCH64_RELATIV                    3350
0000000200b0  000000000403 R_AARCH64_RELATIV                    3358
0000000200d0  000000000403 R_AARCH64_RELATIV                    3360
0000000200f0  000000000403 R_AARCH64_RELATIV                    3370
000000020110  000000000403 R_AARCH64_RELATIV                    3378
000000020130  000000000403 R_AARCH64_RELATIV                    3380
000000020150  000000000403 R_AARCH64_RELATIV                    3388
00000001ffb8  000a00000401 R_AARCH64_GLOB_DA 0000000000000000 _ITM_deregisterTM[...] + 0
00000001ffc0  000b00000401 R_AARCH64_GLOB_DA 0000000000000000 __cxa_finalize@GLIBC_2.17 + 0
00000001ffc8  000f00000401 R_AARCH64_GLOB_DA 0000000000000000 stderr@GLIBC_2.17 + 0
00000001ffd0  001000000401 R_AARCH64_GLOB_DA 0000000000000000 optarg@GLIBC_2.17 + 0
00000001ffd8  001400000401 R_AARCH64_GLOB_DA 0000000000000000 stdout@GLIBC_2.17 + 0
00000001ffe0  001e00000401 R_AARCH64_GLOB_DA 0000000000000000 __gmon_start__ + 0
00000001ffe8  001f00000401 R_AARCH64_GLOB_DA 0000000000000000 __stack_chk_guard@GLIBC_2.17 + 0
00000001fff8  002e00000401 R_AARCH64_GLOB_DA 0000000000000000 _ITM_registerTMCl[...] + 0

Relocation section '.rela.plt' at offset 0xcc8 contains 40 entries:
Offset          Info           Type           Sym. Value    Sym. Name + Addend
00000001fe70  000300000402 R_AARCH64_JUMP_SL 0000000000000000 strtok@GLIBC_2.17 + 0
00000001fe78  000400000402 R_AARCH64_JUMP_SL 0000000000000000 strtoul@GLIBC_2.17 + 0
00000001fe80  000500000402 R_AARCH64_JUMP_SL 0000000000000000 strlen@GLIBC_2.17 + 0
00000001fe88  000600000402 R_AARCH64_JUMP_SL 0000000000000000 fputs@GLIBC_2.17 + 0
00000001fe90  000700000402 R_AARCH64_JUMP_SL 0000000000000000 exit@GLIBC_2.17 + 0
00000001fe98  000800000402 R_AARCH64_JUMP_SL 0000000000000000 __libc_start_main@GLIBC_2.34 + 0
00000001fea0  000900000402 R_AARCH64_JUMP_SL 0000000000000000 perror@GLIBC_2.17 + 0
00000001fea8  000b00000402 R_AARCH64_JUMP_SL 0000000000000000 __cxa_finalize@GLIBC_2.17 + 0
00000001feb0  000c00000402 R_AARCH64_JUMP_SL 0000000000000000 putc@GLIBC_2.17 + 0
00000001fec0  000e00000402 R_AARCH64_JUMP_SL 0000000000000000 fputc@GLIBC_2.17 + 0
00000001fec8  001100000402 R_AARCH64_JUMP_SL 0000000000000000 snprintf@GLIBC_2.17 + 0
00000001fed0  001200000402 R_AARCH64_JUMP_SL 0000000000000000 __snprintf_chk@GLIBC_2.17 + 0
00000001fed8  001300000402 R_AARCH64_JUMP_SL 0000000000000000 malloc@GLIBC_2.17 + 0
00000001fee0  001500000402 R_AARCH64_JUMP_SL 0000000000000000 gettimeofday@GLIBC_2.17 + 0
00000001fee8  001600000402 R_AARCH64_JUMP_SL 0000000000000000 sleep@GLIBC_2.17 + 0
00000001fef0  001700000402 R_AARCH64_JUMP_SL 0000000000000000 __vfprintf_chk@GLIBC_2.17 + 0
00000001fef8  001800000402 R_AARCH64_JUMP_SL 0000000000000000 calloc@GLIBC_2.17 + 0
00000001ff00  001900000402 R_AARCH64_JUMP_SL 0000000000000000 rewind@GLIBC_2.17 + 0
00000001ff08  001a00000402 R_AARCH64_JUMP_SL 0000000000000000 strdup@GLIBC_2.17 + 0
00000001ff10  001b00000402 R_AARCH64_JUMP_SL 0000000000000000 closedir@GLIBC_2.17 + 0
00000001ff18  001c00000402 R_AARCH64_JUMP_SL 0000000000000000 __stack_chk_fail@GLIBC_2.17 + 0
00000001ff20  001d00000402 R_AARCH64_JUMP_SL 0000000000000000 strrchr@GLIBC_2.17 + 0
00000001ff28  001e00000402 R_AARCH64_JUMP_SL 0000000000000000 __gmon_start__ + 0
00000001ff30  002000000402 R_AARCH64_JUMP_SL 0000000000000000 abort@GLIBC_2.17 + 0
00000001ff38  002100000402 R_AARCH64_JUMP_SL 0000000000000000 feof@GLIBC_2.17 + 0
00000001ff40  002200000402 R_AARCH64_JUMP_SL 0000000000000000 getopt_long@GLIBC_2.17 + 0
00000001ff48  002300000402 R_AARCH64_JUMP_SL 0000000000000000 __fprintf_chk@GLIBC_2.17 + 0
00000001ff50  002400000402 R_AARCH64_JUMP_SL 0000000000000000 strcmp@GLIBC_2.17 + 0
00000001ff58  002500000402 R_AARCH64_JUMP_SL 0000000000000000 free@GLIBC_2.17 + 0
00000001ff60  002600000402 R_AARCH64_JUMP_SL 0000000000000000 readdir64@GLIBC_2.17 + 0
00000001ff68  002700000402 R_AARCH64_JUMP_SL 0000000000000000 strndup@GLIBC_2.17 + 0
00000001ff70  002800000402 R_AARCH64_JUMP_SL 0000000000000000 strchr@GLIBC_2.17 + 0
00000001ff78  002900000402 R_AARCH64_JUMP_SL 0000000000000000 fwrite@GLIBC_2.17 + 0
00000001ff80  002a00000402 R_AARCH64_JUMP_SL 0000000000000000 fflush@GLIBC_2.17 + 0
00000001ff88  002b00000402 R_AARCH64_JUMP_SL 0000000000000000 fopen64@GLIBC_2.17 + 0
00000001ff90  002c00000402 R_AARCH64_JUMP_SL 0000000000000000 __isoc99_sscanf@GLIBC_2.17 + 0
00000001ff98  002d00000402 R_AARCH64_JUMP_SL 0000000000000000 strncpy@GLIBC_2.17 + 0
00000001ffa0  002f00000402 R_AARCH64_JUMP_SL 0000000000000000 __assert_fail@GLIBC_2.17 + 0
00000001ffa8  003000000402 R_AARCH64_JUMP_SL 0000000000000000 fgets@GLIBC_2.17 + 0

Rilocazioni relative compresse (RELR)

  • I linker moderni possono emettere rilocazioni relative compatte con -z pack-relative-relocs. Questo aggiunge le voci DT_RELR, DT_RELRSZ, e DT_RELRENT alla sezione dinamica per PIEs/librerie condivise (viene ignorato per eseguibili non-PIE).
  • Recon: readelf -d ./bin | egrep -i "DT_RELR|RELRSZ|RELRENT"

Rilocazioni statiche

Se il programma viene caricato in un luogo diverso dall’indirizzo preferito (di solito 0x400000) perché l’indirizzo è già usato o a causa di ASLR o qualsiasi altra ragione, una rilocazione statica corregge i puntatori che avevano valori che si aspettavano il caricamento del binario all’indirizzo preferito.

Per esempio qualsiasi sezione di tipo R_AARCH64_RELATIV dovrebbe aver modificato l’indirizzo al bias della rilocazione più il valore dell’addend.

Rilocazioni dinamiche e GOT

La rilocazione potrebbe anche fare riferimento a un simbolo esterno (come una funzione di una dipendenza). Come la funzione malloc di libC. Quindi, quando il loader carica libC in un indirizzo controlla dove è caricata la funzione malloc, e scriverà questo indirizzo nella tabella GOT (Global Offset Table) indicata nella relocation table dove dovrebbe essere specificato l’indirizzo di malloc.

Procedure Linkage Table

La sezione PLT permette di eseguire lazy binding, il che significa che la risoluzione della posizione di una funzione verrà eseguita la prima volta che viene acceduta.

Quindi quando un programma chiama malloc, in realtà chiama la corrispondente posizione di malloc nella PLT (malloc@plt). La prima volta che viene chiamata risolve l’indirizzo di malloc e lo memorizza così la prossima volta che malloc viene chiamata, viene usato quell’indirizzo invece del codice PLT.

Comportamenti di linking moderni che impattano l’exploitation

  • -z now (Full RELRO) disabilita il lazy binding; le voci PLT esistono ancora ma GOT/PLT è mappato in sola lettura, quindi tecniche come GOT overwrite e ret2dlresolve non funzioneranno contro il binario principale (le librerie possono ancora essere parzialmente RELRO). See:

Relro

  • -fno-plt fa sì che il compiler chiami funzioni esterne attraverso la GOT entry direttamente invece di passare per lo stub PLT. Vedrai sequenze di call come mov reg, [got]; call reg invece di call func@plt. Questo riduce l’abuso di speculative-execution e modifica leggermente la ricerca di gadget ROP intorno agli stub PLT.

  • PIE vs static-PIE: PIE (ET_DYN with INTERP) necessita del dynamic loader e supporta la solita macchina PLT/GOT. Static-PIE (ET_DYN without INTERP) ha le rilocazioni applicate dal kernel loader e nessun ld.so; aspettati nessuna risoluzione PLT a runtime.

Se GOT/PLT non è un’opzione, pivotare verso altri code-pointer scrivibili o usare il classico ROP/SROP su libc.

WWW2Exec - GOT/PLT

Inizializzazione del programma

Dopo che il programma è stato caricato è ora che venga eseguito. Tuttavia, il primo codice eseguito non è sempre la main funzione. Questo perché, ad esempio in C++ se una variabile globale è un oggetto di una classe, questo oggetto deve essere inizializzato prima che main venga eseguito, come in:

#include <stdio.h>
// g++ autoinit.cpp -o autoinit
class AutoInit {
public:
AutoInit() {
printf("Hello AutoInit!\n");
}
~AutoInit() {
printf("Goodbye AutoInit!\n");
}
};

AutoInit autoInit;

int main() {
printf("Main\n");
return 0;
}

Nota che queste variabili globali sono collocate in .data o .bss ma nelle liste __CTOR_LIST__ e __DTOR_LIST__ gli oggetti da inizializzare e distruggere sono memorizzati per tenerne traccia.

Dal codice C è possibile ottenere lo stesso risultato usando le GNU extensions :

__attribute__((constructor)) //Add a constructor to execute before
__attribute__((destructor)) //Add to the destructor list

Dal punto di vista del compilatore, per eseguire queste azioni prima e dopo che la funzione main venga eseguita, è possibile creare una funzione init e una fini che verrebbero referenziate nella sezione dinamica come INIT e FINI, e sono collocate nelle sezioni init e fini dell’ELF.

Un’altra opzione, come accennato, è fare riferimento alle liste __CTOR_LIST__ e __DTOR_LIST__ nelle voci INIT_ARRAY e FINI_ARRAY nella sezione dinamica; la lunghezza di queste è indicata da INIT_ARRAYSZ e FINI_ARRAYSZ. Ogni voce è un puntatore a funzione che verrà invocato senza argomenti.

Inoltre, è anche possibile avere un PREINIT_ARRAY con puntatori che verranno eseguiti prima dei puntatori INIT_ARRAY.

Nota di sfruttamento

  • Sotto Partial RELRO questi array risiedono in pagine ancora scrivibili prima che ld.so imposti PT_GNU_RELRO come sola lettura. Se ottieni una scrittura arbitraria abbastanza presto o puoi mirare agli array scrivibili di una libreria, puoi dirottare il flusso di controllo sovrascrivendo una voce con la funzione che preferisci. Con Full RELRO sono sola lettura a runtime.

  • Per l’abuso del lazy binding del dynamic linker per risolvere simboli arbitrari a runtime, vedi la pagina dedicata:

Ret2dlresolve

Ordine di inizializzazione

  1. Il programma viene caricato in memoria, le variabili globali statiche inizializzate sono posizionate in .data e quelle non inizializzate azzerate in .bss.
  2. Tutte le dipendenze del programma o delle librerie vengono inizializzate ed è eseguito il dynamic linking.
  3. Vengono eseguite le funzioni PREINIT_ARRAY.
  4. Vengono eseguite le funzioni `INIT_ARRAY``.
  5. Se è presente una voce INIT, questa viene chiamata.
  6. Se è una libreria, dlopen termina qui; se è un programma, è il momento di chiamare il vero punto di ingresso (la funzione main).

Thread-Local Storage (TLS)

Sono definite usando la keyword __thread_local in C++ o l’estensione GNU __thread.

Ogni thread mantiene una posizione unica per questa variabile, quindi solo il thread può accedervi.

Quando ciò è usato, nell’ELF vengono utilizzate le sezioni .tdata e .tbss, che sono come .data (inizializzate) e .bss (non inizializzate) ma per TLS.

Ogni variabile avrà una voce nell’header TLS che specifica la dimensione e il TLS offset, che è l’offset che userà nell’area di dati locale del thread.

Il simbolo __TLS_MODULE_BASE è usato per riferirsi all’indirizzo base della thread local storage e punta all’area di memoria che contiene tutti i dati thread-local di un modulo.

Auxiliary Vector (auxv) and vDSO

Il kernel Linux passa un auxiliary vector ai processi contenente indirizzi utili e flag per il runtime:

  • AT_RANDOM: punta a 16 byte casuali usati da glibc per lo stack canary e altri seed del PRNG.
  • AT_SYSINFO_EHDR: indirizzo base della mappatura vDSO (utile per trovare syscall __kernel_* e gadget).
  • AT_EXECFN, AT_BASE, AT_PAGESZ, etc.

Come attaccante, se puoi leggere la memoria o i file sotto /proc, spesso puoi ottenere questi valori tramite leak senza un infoleak nel processo target:

# Show the auxv of a running process
cat /proc/$(pidof target)/auxv | xxd

# From your own process (helper snippet)
#include <sys/auxv.h>
#include <stdio.h>
int main(){
printf("AT_RANDOM=%p\n", (void*)getauxval(AT_RANDOM));
printf("AT_SYSINFO_EHDR=%p\n", (void*)getauxval(AT_SYSINFO_EHDR));
}

Il leak di AT_RANDOM ti dà il canary value se puoi dereferenziare quel puntatore; AT_SYSINFO_EHDR ti dà una base vDSO da esplorare per gadgets o per chiamare direttamente syscalls veloci.

Riferimenti

  • GCC Common Function Attributes (ifunc / STT_GNU_IFUNC): https://gcc.gnu.org/onlinedocs/gcc-14.3.0/gcc/Common-Function-Attributes.html
  • GNU ld -z pack-relative-relocs / DT_RELR docs: https://sourceware.org/binutils/docs/ld.html
  • ld.so(8) – Dynamic Loader search order, RPATH/RUNPATH, secure-execution rules (AT_SECURE): https://man7.org/linux/man-pages/man8/ld.so.8.html
  • getauxval(3) – Auxiliary vector and AT_* constants: https://man7.org/linux/man-pages/man3/getauxval.3.html

Tip

Impara e pratica il hacking AWS:HackTricks Training AWS Red Team Expert (ARTE)
Impara e pratica il hacking GCP: HackTricks Training GCP Red Team Expert (GRTE) Impara e pratica il hacking Azure: HackTricks Training Azure Red Team Expert (AzRTE)

Supporta HackTricks