Satisfiability Modulo Theories (SMT) - Z3

Tip

Aprenda e pratique Hacking AWS:HackTricks Training AWS Red Team Expert (ARTE)
Aprenda e pratique Hacking GCP: HackTricks Training GCP Red Team Expert (GRTE) Aprenda e pratique Hacking Azure: HackTricks Training Azure Red Team Expert (AzRTE)

Supporte o HackTricks

Confira os planos de assinatura!

Junte-se ao 💬 grupo do Discord ou ao grupo do telegram ou siga-nos no Twitter 🐦 @hacktricks_live.

Compartilhe truques de hacking enviando PRs para o HackTricks e HackTricks Cloud repositórios do github.

Basicamente, esta ferramenta nos ajuda a encontrar valores para variáveis que precisam satisfazer certas condições — calcular isso manualmente pode ser muito trabalhoso. Portanto, você pode indicar ao Z3 as condições que as variáveis devem satisfazer e ele encontrará alguns valores (se possível).

Alguns textos e exemplos são extraídos de https://ericpony.github.io/z3py-tutorial/guide-examples.htm

Operações Básicas

Booleans/And/Or/Not

#pip3 install z3-solver
from z3 import *
s = Solver() #The solver will be given the conditions

x = Bool("x") #Declare the symbos x, y and z
y = Bool("y")
z = Bool("z")

# (x or y or !z) and y
s.add(And(Or(x,y,Not(z)),y))
s.check() #If response is "sat" then the model is satifable, if "unsat" something is wrong
print(s.model()) #Print valid values to satisfy the model

Ints/Simplify/Reals

from z3 import *

x = Int('x')
y = Int('y')
#Simplify a "complex" ecuation
print(simplify(And(x + 1 >= 3, x**2 + x**2 + y**2 + 2 >= 5)))
#And(x >= 2, 2*x**2 + y**2 >= 3)

#Note that Z3 is capable to treat irrational numbers (An irrational algebraic number is a root of a polynomial with integer coefficients. Internally, Z3 represents all these numbers precisely.)
#so you can get the decimals you need from the solution
r1 = Real('r1')
r2 = Real('r2')
#Solve the ecuation
print(solve(r1**2 + r2**2 == 3, r1**3 == 2))
#Solve the ecuation with 30 decimals
set_option(precision=30)
print(solve(r1**2 + r2**2 == 3, r1**3 == 2))

Imprimindo o modelo

from z3 import *

x, y, z = Reals('x y z')
s = Solver()
s.add(x > 1, y > 1, x + y > 3, z - x < 10)
s.check()

m = s.model()
print ("x = %s" % m[x])
for d in m.decls():
print("%s = %s" % (d.name(), m[d]))

Aritmética de Máquina

CPUs modernas e as principais linguagens de programação usam aritmética sobre bit-vectors de tamanho fixo. A aritmética de máquina está disponível no Z3Py como Bit-Vectors.

from z3 import *

x = BitVec('x', 16) #Bit vector variable "x" of length 16 bit
y = BitVec('y', 16)

e = BitVecVal(10, 16) #Bit vector with value 10 of length 16bits
a = BitVecVal(-1, 16)
b = BitVecVal(65535, 16)
print(simplify(a == b)) #This is True!
a = BitVecVal(-1, 32)
b = BitVecVal(65535, 32)
print(simplify(a == b)) #This is False

Números com sinal/sem sinal

Z3 fornece versões especiais com sinal das operações aritméticas quando faz diferença se o vetor de bits é tratado como com sinal ou sem sinal. Em Z3Py, os operadores <, <=, >, >=, /, % e >> correspondem às versões com sinal. Os operadores correspondentes sem sinal são ULT, ULE, UGT, UGE, UDiv, URem e LShR.

from z3 import *

# Create to bit-vectors of size 32
x, y = BitVecs('x y', 32)
solve(x + y == 2, x > 0, y > 0)

# Bit-wise operators
# & bit-wise and
# | bit-wise or
# ~ bit-wise not
solve(x & y == ~y)
solve(x < 0)

# using unsigned version of <
solve(ULT(x, 0))

Bit-vector helpers comumente necessários em reversing

Quando você está lifting checks from assembly or decompiler output, geralmente é melhor modelar cada byte de entrada como um BitVec(..., 8) e então reconstruir palavras exatamente como o código alvo faz. Isso evita bugs causados por misturar inteiros matemáticos com aritmética de máquina.

from z3 import *

b0, b1, b2, b3 = BitVecs('b0 b1 b2 b3', 8)
eax = Concat(b3, b2, b1, b0)        # little-endian bytes -> 32-bit register value
low_byte = Extract(7, 0, eax)        # AL
high_word = Extract(31, 16, eax)     # upper 16 bits
signed_b0 = SignExt(24, b0)          # movsx eax, byte ptr [...]
unsigned_b0 = ZeroExt(24, b0)        # movzx eax, byte ptr [...]
rot = RotateLeft(eax, 13)            # rol eax, 13
logical = LShR(eax, 3)               # shr eax, 3
arith = eax >> 3                     # sar eax, 3 (signed shift)

Algumas armadilhas comuns ao traduzir código em constraints:

>> é um deslocamento à direita aritmético para vetores de bits. Use LShR para a instrução lógica shr.
Use UDiv, URem, ULT, ULE, UGT e UGE quando a comparação/divisão original era sem sinal.
Mantenha as larguras explícitas. Se o binário truncar para 8 ou 16 bits, adicione Extract ou reconstrua o valor com Concat em vez de promover tudo silenciosamente para inteiros Python.

Funções

Funções interpretadas tais como operações aritméticas, onde a função + tem uma interpretação padrão fixa (ela soma dois números). Funções não interpretadas e constantes são extremamente flexíveis; elas permitem qualquer interpretação que seja consistente com as restrições sobre a função ou constante.

Exemplo: f aplicada duas vezes a x resulta em x novamente, mas f aplicada uma vez a x é diferente de x.

from z3 import *

x = Int('x')
y = Int('y')
f = Function('f', IntSort(), IntSort())
s = Solver()
s.add(f(f(x)) == x, f(x) == y, x != y)
s.check()
m = s.model()
print("f(f(x)) =", m.evaluate(f(f(x))))
print("f(x)    =", m.evaluate(f(x)))

print(m.evaluate(f(2)))
s.add(f(x) == 4) #Find the value that generates 4 as response
s.check()
print(m.model())

Exemplos

Resolvedor de Sudoku

# 9x9 matrix of integer variables
X = [ [ Int("x_%s_%s" % (i+1, j+1)) for j in range(9) ]
for i in range(9) ]

# each cell contains a value in {1, ..., 9}
cells_c  = [ And(1 <= X[i][j], X[i][j] <= 9)
for i in range(9) for j in range(9) ]

# each row contains a digit at most once
rows_c   = [ Distinct(X[i]) for i in range(9) ]

# each column contains a digit at most once
cols_c   = [ Distinct([ X[i][j] for i in range(9) ])
for j in range(9) ]

# each 3x3 square contains a digit at most once
sq_c     = [ Distinct([ X[3*i0 + i][3*j0 + j]
for i in range(3) for j in range(3) ])
for i0 in range(3) for j0 in range(3) ]

sudoku_c = cells_c + rows_c + cols_c + sq_c

# sudoku instance, we use '0' for empty cells
instance = ((0,0,0,0,9,4,0,3,0),
(0,0,0,5,1,0,0,0,7),
(0,8,9,0,0,0,0,4,0),
(0,0,0,0,0,0,2,0,8),
(0,6,0,2,0,1,0,5,0),
(1,0,2,0,0,0,0,0,0),
(0,7,0,0,0,0,5,2,0),
(9,0,0,0,6,5,0,0,0),
(0,4,0,9,7,0,0,0,0))

instance_c = [ If(instance[i][j] == 0,
True,
X[i][j] == instance[i][j])
for i in range(9) for j in range(9) ]

s = Solver()
s.add(sudoku_c + instance_c)
if s.check() == sat:
m = s.model()
r = [ [ m.evaluate(X[i][j]) for j in range(9) ]
for i in range(9) ]
print_matrix(r)
else:
print "failed to solve"

Fluxos de trabalho de Reversing

Se você precisar executar simbolicamente o binário e coletar restrições automaticamente, consulte as notas do angr aqui:

Angr

Se você já está analisando as verificações decompiladas e só precisa resolvê-las, o Z3 puro normalmente é mais rápido e mais fácil de controlar.

Extraindo verificações baseadas em bytes de um crackme

Um padrão muito comum em crackmes e packed loaders é uma longa lista de equações por byte sobre uma senha candidata. Modele os bytes como vetores de 8 bits, restrinja o alfabeto e só os amplie quando o código original os ampliar.

Exemplo: reconstruir uma verificação de serial a partir da aritmética decompilada

```python from z3 import *

flag = [BitVec(f’flag_{i}’, 8) for i in range(8)] s = Solver()

for c in flag: s.add(c >= 0x20, c <= 0x7e)

w0 = Concat(flag[3], flag[2], flag[1], flag[0]) w1 = Concat(flag[7], flag[6], flag[5], flag[4])

s.add((ZeroExt(24, flag[0]) + ZeroExt(24, flag[5])) == 0x90) s.add((flag[1] ^ flag[2] ^ flag[3]) == 0x5a) s.add(RotateLeft(w0, 7) ^ w1 == BitVecVal(0x4f625a13, 32)) s.add(ULE(flag[6], flag[7])) s.add(LShR(w1, 5) == BitVecVal(0x03a1f21, 32))

if s.check() == sat: m = s.model() print(bytes(m[c].as_long() for c in flag))

</details>

Esse estilo se encaixa bem na engenharia reversa do mundo real porque corresponde ao que os writeups modernos fazem na prática: recuperar as relações aritméticas e bit a bit, transformar cada comparação em uma restrição e resolver todo o sistema de uma vez.

#### Resolução incremental com `push()` / `pop()`

Durante a engenharia reversa, você frequentemente quer testar várias hipóteses sem reconstruir todo o solver. `push()` cria um checkpoint e `pop()` descarta as restrições adicionadas após esse checkpoint. Isso é útil quando você não tem certeza se um branch é com sinal ou sem sinal, se um registrador é estendido por zeros ou por sinal, ou quando está testando várias constantes candidatas extraídas da desmontagem.
```python
from z3 import *

x = BitVec('x', 32)
s = Solver()
s.add((x & 0xff) == 0x41)

s.push()
s.add(UGT(x, 0x1000))
print(s.check())
s.pop()

s.push()
s.add(x == 0x41)
print(s.check())
print(s.model())
s.pop()

Enumerando mais de uma entrada válida

Alguns keygens, license checks e CTF challenges admitem intencionalmente muitas entradas válidas. Z3 não as enumera automaticamente, mas você pode adicionar uma cláusula de bloqueio após cada modelo para forçar que o próximo resultado difira em pelo menos uma posição.

from z3 import *

xs = [BitVec(f'x{i}', 8) for i in range(4)]
s = Solver()
for x in xs:
s.add(And(x >= 0x30, x <= 0x39))
s.add(xs[0] + xs[1] == xs[2] + 1)
s.add(xs[3] == xs[0] ^ 3)

while s.check() == sat:
m = s.model()
print(''.join(chr(m[x].as_long()) for x in xs))
s.add(Or([x != m.eval(x, model_completion=True) for x in xs]))

Táticas para fórmulas feias de bit-vector

O solver padrão do Z3 geralmente é suficiente, mas fórmulas geradas por decompiladores com muitas igualdades e reescritas de bit-vector frequentemente ficam mais fáceis após uma primeira passagem de normalização. Nesses casos, pode ser útil construir um solver a partir de táticas:

from z3 import *

t = Then('simplify', 'solve-eqs', 'bit-blast', 'sat')
s = t.solver()

Isto é especialmente útil quando o problema é quase inteiramente bit-vector + Boolean logic e você quer que o Z3 simplifique e elimine igualdades óbvias antes de passar a fórmula para o SAT backend.

CRCs and other custom checkers

Desafios recentes de reversing ainda usam Z3 para restrições que são incômodas de brute-force mas diretas de modelar, como checagens CRC32 sobre entrada ASCII-only, pipelines mistos rotate/xor/add, ou muitos predicados aritméticos encadeados extraídos de um checker JITed/obfuscated. Para problemas do tipo CRC-like, mantenha o estado como bit-vectors e aplique restrições per-byte ASCII cedo para reduzir o espaço de busca.

Referências

Tip

Aprenda e pratique Hacking AWS:HackTricks Training AWS Red Team Expert (ARTE)
Aprenda e pratique Hacking GCP: HackTricks Training GCP Red Team Expert (GRTE) Aprenda e pratique Hacking Azure: HackTricks Training Azure Red Team Expert (AzRTE)

Supporte o HackTricks

Confira os planos de assinatura!

Junte-se ao 💬 grupo do Discord ou ao grupo do telegram ou siga-nos no Twitter 🐦 @hacktricks_live.

Compartilhe truques de hacking enviando PRs para o HackTricks e HackTricks Cloud repositórios do github.