exrop/Solver.py at master · d4em0n/exrop · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
import copy
from triton import *
from Gadget import *
from Gadget import _extract_reg_offset
from RopChain import *

def _has_badchar(addr, avoid_char):
    addrb = addr.to_bytes(8, 'little')
    for char in avoid_char:
        if char in addrb:
            return True
    return False

def findCandidatesWriteGadgets(gadgets, avoid_char=None):
    candidates = {}
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if gadget.is_memory_write:
            isw = gadget.is_memory_write
            if isw not in candidates:
                candidates[isw] = [gadget]
            else:
                candidates[isw].append(gadget)
    return candidates

def findForRet(gadgets, min_diff_sp=0, not_write_regs=None, avoid_char=None):
    if not_write_regs is None:
        not_write_regs = set()
    best = None
    best_score = (999, 999)
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if isintersect(not_write_regs, gadget.written_regs):
            continue
        if not gadget.is_memory_read and not gadget.is_memory_write and not gadget.is_syscall and gadget.end_type == TYPE_RETURN and gadget.diff_sp >= min_diff_sp and 'push' not in gadget.insstr:
            # Prefer exact diff_sp match, then fewer written registers
            score = (0 if gadget.diff_sp == min_diff_sp else 1, len(gadget.written_regs))
            if score < best_score:
                best = gadget
                best_score = score
                if score == (0, 0):
                    break
    return best

def findPivot(gadgets, not_write_regs=None, avoid_char=None):
    if not_write_regs is None:
        not_write_regs = set()
    candidates = []
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if isintersect(not_write_regs, gadget.written_regs):
            continue
        if gadget.pivot:
            candidates.append(gadget)
    return candidates

def findSyscall(gadgets, not_write_regs=None, avoid_char=None):
    if not_write_regs is None:
        not_write_regs = set()
    syscall_noret = None
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if isintersect(not_write_regs, gadget.written_regs):
            continue
        if not gadget.is_memory_read and not gadget.is_memory_write and gadget.is_syscall:
            if gadget.end_type == TYPE_RETURN:
                return gadget
            syscall_noret = gadget
    return syscall_noret

def findCandidatesGadgets(gadgets, regs_write, regs_items, not_write_regs=None, avoid_char=None, cand_write_first=False):
    if not_write_regs is None:
        not_write_regs = set()
    candidates_pop = []
    candidates_write = []
    candidates_defined = []
    candidates_defined2_ret = []   # exact match + clean ret ending
    candidates_defined2_other = [] # exact match but needs jmp/call fixup
    candidates_for_ret = []
    depends_regs = set()
    remaining = []

    for gadget in gadgets:
        # Filter out unusable gadgets entirely
        if (isintersect(not_write_regs, gadget.written_regs) or
                gadget.is_memory_read or gadget.is_memory_write or
                gadget.end_type in (TYPE_UNKNOWN, TYPE_JMP_MEM, TYPE_CALL_MEM)):
            continue

        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue

        # Categorize by how the gadget writes target registers
        if isintersect(regs_write, set(gadget.defined_regs.keys())):
            if regs_items and isintersect(regs_items, set(gadget.defined_regs.items())):
                if gadget.end_type == TYPE_RETURN:
                    candidates_defined2_ret.append(gadget)
                else:
                    candidates_defined2_other.append(gadget)
            else:
                candidates_defined.append(gadget)
            depends_regs.update(gadget.depends_regs)
        elif isintersect(regs_write, gadget.popped_regs):
            candidates_pop.append(gadget)
            depends_regs.update(gadget.depends_regs)
        elif isintersect(regs_write, gadget.written_regs):
            candidates_write.append(gadget)
            depends_regs.update(gadget.depends_regs)
        else:
            remaining.append(gadget)

    # Recursively find gadgets for dependency registers from unclaimed gadgets
    candidates_depends = []
    if depends_regs:
        candidates_depends = findCandidatesGadgets(remaining, depends_regs, set(), not_write_regs)

    # Sort pop candidates: prefer ret-ending, smaller diff_sp, fewer side-effect writes
    # Gadgets with diff_sp <= 0 are pathological (more pushes than pops) and must not
    # be preferred — their model references STACK slots beyond num_slots.
    candidates_pop.sort(key=lambda g: (g.end_type != TYPE_RETURN, g.diff_sp if g.diff_sp > 0 else 0x7fffffffffffffff, len(g.written_regs)))

    # Priority: clean ret-ending exact match > pop > non-ret exact match > other defined > write
    if cand_write_first:
        candidates = candidates_write + candidates_defined2_ret + candidates_pop + candidates_defined2_other + candidates_defined + candidates_depends
    else:
        candidates = candidates_defined2_ret + candidates_pop + candidates_defined2_other + candidates_defined + candidates_write + candidates_depends

    # Add small ret/nop gadgets as helpers for non-return fixups
    for gadget in remaining:
        if gadget.diff_sp in (8, 0):
            candidates_for_ret.append(gadget)

    candidates += candidates_for_ret
    return candidates

def filter_byte(astctxt, bv, bc, bsize):
    nbv = []
    for i in range(bsize):
        nbv.append(astctxt.lnot(astctxt.equal(astctxt.extract(i*8+7, i*8, bv), astctxt.bv(bc, 8))))
    return nbv

def check_contain_avoid_char(regvals, avoid_char):
    for char in avoid_char:
        for val in regvals:
            if isinstance(val, str):
                continue
            valb = val.to_bytes(8, 'little')
            if char in valb:
                return True
    return False

def get_all_written(tmp_solved):
    written_regs = set()
    for solved in tmp_solved:
        written_regs.update(solved.get_written_regs())
    return written_regs

def get_all_solved(tmp_solved):
    solved_regs = set()
    for solved in tmp_solved:
        solved_regs.update(solved.get_solved_regs())
    return solved_regs

def insert_tmp_solved(tmp_solved, solved):
    intersect = False
    if isintersect(solved.get_written_regs(), get_all_solved(tmp_solved)):
        intersect = True
    if intersect and len(tmp_solved) > 0:
        for i in range(len(tmp_solved)-1, -1, -1):
            solved_before = get_all_solved(tmp_solved[:i+1])
            if isintersect(solved.get_solved_regs(), tmp_solved[i].get_written_regs()) and not isintersect(solved_before, solved.get_written_regs()):
                tmp_solved.insert(i+1, solved)
                break
            regs_used_after = get_all_written(tmp_solved)
            if i == 0:
                if not isintersect(solved.get_solved_regs(), regs_used_after):
                    tmp_solved.insert(0, solved)
                else:
                    return False
    else:
        tmp_solved.append(solved)
    return True

def solveGadgets(gadgets, solves, avoid_char=None, keep_regs=None, add_type=None, for_refind=None, rec_limit=0):
    if keep_regs is None:
        keep_regs = set()
    if add_type is None:
        add_type = dict()
    if for_refind is None:
        for_refind = set()

    # Work on a copy so partial failures don't corrupt the caller's dict
    original_solves = dict(solves)
    solves = dict(solves)

    if rec_limit >= 30:
        return []

    find_write_first = False
    if avoid_char:
        find_write_first = check_contain_avoid_char(solves.values(), avoid_char)
    candidates = findCandidatesGadgets(gadgets[:], set(solves.keys()), set(solves.items()), avoid_char=avoid_char, cand_write_first=find_write_first)

    ctx = initialize()
    astCtxt = ctx.getAstContext()
    chains = RopChain()

    return _solveLoop(gadgets, solves, original_solves, candidates, avoid_char, keep_regs, add_type, for_refind, rec_limit, ctx, astCtxt, chains)


def _solveLoop(gadgets, solves, original_solves, candidates, avoid_char, keep_regs, add_type, for_refind, rec_limit, ctx, astCtxt, chains, _restarts=0):
    regs = ["rax", "rbx", "rcx", "rdx", "rsi", "rdi", "rbp", "r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15"]
    reg_refind = set()

    # For pure reg-to-reg solves, reorder candidates by BFS hop distance
    _reg_targets = {v for v in solves.values() if isinstance(v, str)}
    if _reg_targets and all(isinstance(v, str) for v in solves.values()):
        _xfer = {}
        for g in candidates:
            for d, s in g.defined_regs.items():
                if isinstance(s, str):
                    _xfer.setdefault(s, set()).add(d)
        _reach = {}
        for tv in _reg_targets:
            frontier = {tv}
            for hop in range(1, 4):
                nxt = set()
                for src in frontier:
                    for dst in _xfer.get(src, ()):
                        if dst not in _reach or hop < _reach[dst]:
                            _reach[dst] = hop
                            nxt.add(dst)
                frontier = nxt
        if _reach:
            def _hop_key(idx_g):
                idx, g = idx_g
                best = 50
                for reg, val in solves.items():
                    if reg in g.defined_regs:
                        inter = g.defined_regs[reg]
                        if isinstance(inter, str):
                            if inter in _reg_targets:
                                best = min(best, 0)
                            elif inter in _reach:
                                best = min(best, _reach[inter])
                return (best, idx)
            indexed = list(enumerate(candidates))
            indexed.sort(key=_hop_key)
            candidates = [g for _, g in indexed]

    for gadget in candidates:
        tmp_solved_ordered = []
        tmp_solved_regs = set()
        tmp_solved_ordered2 = []
        reg_to_reg_solve = set()

        if isintersect(keep_regs, gadget.written_regs):
            continue

        for reg, val in solves.items():
            if reg not in gadget.written_regs or reg in gadget.end_reg_used:
                continue

            if reg in gadget.defined_regs and gadget.defined_regs[reg] == val:
                tmp_solved_regs.add(reg)
                tmp_solved_ordered.append([])
                if isinstance(val, str):
                    reg_to_reg_solve.add(val)
                continue

            refind_dict = {}
            if isinstance(val, str):
                if reg in gadget.defined_regs and isinstance(gadget.defined_regs[reg], str) and gadget.defined_regs[reg] != reg:
                    refind_dict[gadget.defined_regs[reg]] = val
                    result = []
                else:
                    continue
            else:
                # SMT solving requires AST — rebuild if needed (lazy)
                if not gadget.is_asted:
                    gadget.buildAst()
                regAst = gadget.regAst[reg]
                if avoid_char:
                    if reg in gadget.defined_regs and isinstance(gadget.defined_regs[reg], int):
                        continue
                    childs = astCtxt.search(regAst, AST_NODE.VARIABLE)
                    filterbyte = []
                    result = False
                    valb = val.to_bytes(8, 'little')
                    lval = len(valb.strip(b"\x00"))
                    for char in avoid_char:
                        if char in valb:
                            for child in childs:
                                for char in avoid_char:
                                    fb = filter_byte(astCtxt, child, char, lval)
                                    filterbyte.extend(fb)
                            if filterbyte:
                                filterbyte.append(regAst == astCtxt.bv(val, 64))
                    if filterbyte:
                        filterbyte = astCtxt.land(filterbyte)
                        result = list(ctx.getModel(filterbyte).values())
                    if not result:
                        result = list(ctx.getModel(regAst == astCtxt.bv(val, 64)).values())

                else:
                    result = list(ctx.getModel(regAst == astCtxt.bv(val, 64)).values())

            for v in result:
                alias = v.getVariable().getAlias()
                if 'STACK' not in alias:
                    if alias in regs and alias not in refind_dict:
                        if alias == reg and avoid_char:
                            valb = v.getValue().to_bytes(8, 'little')
                            for char in avoid_char:
                                if char in valb:
                                    result = False
                                    refind_dict = False
                            if not result:
                                break

                        if ((alias != reg and (alias, val) not in for_refind) or v.getValue() != val):
                            refind_dict[alias] = v.getValue()
                        else:
                            result = False
                            refind_dict = False
                            break
                    else:
                        result = False
                        break
                elif avoid_char:
                    for char in avoid_char:
                        if char in val.to_bytes(8, 'little'):
                            result = False
                            refind_dict = False
                            break
            if refind_dict:
                tmp_for_refind = for_refind.copy()
                tmp_for_refind.add((reg, val))
                reg_refind.update(set(list(refind_dict.keys())))
                refind_keep = keep_regs.copy()
                if isinstance(val, str):
                    refind_keep = refind_keep | {val}
                result = solveGadgets(candidates[:], refind_dict, avoid_char, keep_regs=refind_keep, for_refind=tmp_for_refind, rec_limit=rec_limit+1)

            if result:
                if isinstance(val, str):
                    reg_to_reg_solve.add(gadget.defined_regs[reg])
                if not isinstance(result, RopChain):
                    type_chain = CHAINITEM_TYPE_VALUE
                    if add_type and reg in add_type and add_type[reg] == CHAINITEM_TYPE_ADDR:
                        type_chain = CHAINITEM_TYPE_ADDR
                    result = ChainItem.parseFromModel(result, type_val=type_chain)
                    tmp_solved_ordered.append(result)
                    tmp_solved_regs.add(reg)
                else:
                    if insert_tmp_solved(tmp_solved_ordered2, result):
                        tmp_solved_regs.add(reg)

        if not tmp_solved_regs:
            continue

        if gadget.end_type != TYPE_RETURN:
            if not gadget.is_asted:
                gadget.buildAst()
            if isintersect(set(list(solves.keys())), gadget.end_reg_used) or not gadget.end_ast:
                continue
            next_gadget = None
            diff = 0
            # Protect unsolved registers AND their source registers so the
            # end_gadget doesn't clobber a target or source needed later.
            unsolved_regs = {r for r in solves if r not in tmp_solved_regs}
            unsolved_src_regs = {v for r, v in solves.items() if isinstance(v, str) and r not in tmp_solved_regs}
            not_write = tmp_solved_regs | keep_regs | unsolved_regs | unsolved_src_regs
            if gadget.end_type == TYPE_JMP_REG:
                need_sp = max(0, -gadget.diff_sp)
                next_gadget = findForRet(candidates[:], need_sp, not_write, avoid_char=avoid_char)
            elif gadget.end_type == TYPE_CALL_REG:
                need_sp = max(8, 8 - gadget.diff_sp)
                next_gadget = findForRet(candidates[:], need_sp, not_write, avoid_char=avoid_char)
                diff = 8
            if not next_gadget:
                continue

            # Shallow copy to avoid permanently mutating the shared gadget object
            gadget = copy.copy(gadget)
            gadget.end_gadget = next_gadget
            gadget.diff_sp += next_gadget.diff_sp - diff

            regAst = gadget.end_ast
            val = gadget.end_gadget.addr
            result = list(ctx.getModel(regAst == val).values())

            refind_dict = {}
            type_chains = {}
            for v in result:
                alias = v.getVariable().getAlias()
                if 'STACK' not in alias:
                    if alias in regs and alias not in refind_dict:
                        refind_dict[alias] = v.getValue()
                        type_chains[alias] = CHAINITEM_TYPE_ADDR
                    else:
                        result = False
                        break
            if refind_dict:
                reg_to_reg_solve.update(tmp_solved_regs)
                reg_to_reg_solve.update(reg_refind)
                _refind_keep = reg_to_reg_solve | keep_regs
                result = solveGadgets(gadgets, refind_dict, avoid_char, add_type=type_chains, keep_regs=_refind_keep, rec_limit=rec_limit+1)
            if not result:
                continue
            if not isinstance(result, RopChain):
                type_chain = CHAINITEM_TYPE_ADDR
                result = ChainItem.parseFromModel(result, type_val=type_chain)
                tmp_solved_ordered.append(result)
            else:
                insert_tmp_solved(tmp_solved_ordered2, result)

        tmp_solved_ordered.extend(tmp_solved_ordered2)
        dep_regs = set()
        if reg_to_reg_solve:
            dep_regs = reg_to_reg_solve - tmp_solved_regs

        tmp_chain = Chain()
        if tmp_chain.set_solved(gadget, tmp_solved_ordered, tmp_solved_regs, depends_regs=dep_regs) is False:
            continue

        if not chains.insert_chain(tmp_chain):
            continue

        for reg in tmp_solved_regs:
            if reg in solves:
                del solves[reg]

        # Check if insertion caused ordering conflicts: a later chain
        # clobbers an earlier chain's solved_regs.  Evict the later
        # chain and re-add its registers for re-solving with keep_regs
        # protecting the regs that were being clobbered.
        # Restart from scratch so fresh candidates are searched.
        evicted = chains.evict_clobbered()
        if evicted and _restarts < 5:
            for reg in evicted:
                if reg in original_solves:
                    solves[reg] = original_solves[reg]
            keep_regs = keep_regs | chains.get_solved_regs()
            find_write_first = False
            if avoid_char:
                find_write_first = check_contain_avoid_char(solves.values(), avoid_char)
            candidates = findCandidatesGadgets(gadgets[:], set(solves.keys()), set(solves.items()), avoid_char=avoid_char, cand_write_first=find_write_first)
            return _solveLoop(gadgets, solves, original_solves, candidates, avoid_char, keep_regs, add_type, for_refind, rec_limit, ctx, astCtxt, chains, _restarts + 1)

        if not solves:
            return chains

    # Partial progress but remaining regs unsolvable in this order.
    # Restart with a different solve order: deprioritize the regs we
    # just committed so a different reg gets solved first.
    if solves and chains.chains and _restarts < 5:
        defer_regs = set(original_solves) - set(solves)
        solves = dict(original_solves)
        chains.chains.clear()
        find_write_first = False
        if avoid_char:
            find_write_first = check_contain_avoid_char(solves.values(), avoid_char)
        candidates = findCandidatesGadgets(gadgets[:], set(solves.keys()), set(solves.items()), avoid_char=avoid_char, cand_write_first=find_write_first)
        # Move gadgets that ONLY solve deferred regs to the end
        head, tail = [], []
        for g in candidates:
            solves_other = False
            for r, v in solves.items():
                if r not in defer_regs and r in g.defined_regs:
                    solves_other = True
                    break
            if solves_other:
                head.append(g)
            else:
                tail.append(g)
        candidates = head + tail
        return _solveLoop(gadgets, solves, original_solves, candidates, avoid_char, keep_regs, add_type, for_refind, rec_limit, ctx, astCtxt, chains, _restarts + 1)

    return []

def _resolve_write_operand(ctx, operand_ast, target, regs, refind_dict):
    """Resolve one side (addr or val) of a write gadget.

    target is either an int (constant) or a str (register name).
    Returns True on success, False on failure.  On success, any register
    dependencies are added to refind_dict.
    """
    if isinstance(target, str) and target in regs:
        # Register-based operand
        ast_str = str(operand_ast)
        if ast_str == target:
            return True  # direct match, nothing to solve
        if ast_str in regs:
            # Gadget uses a different register — need reg-to-reg forwarding
            if ast_str in refind_dict and refind_dict[ast_str] != target:
                return False  # conflict
            refind_dict[ast_str] = target
            return True
        return False  # complex AST expression, can't handle
    else:
        # Constant operand — solve via SMT model
        model = list(ctx.getModel(operand_ast == target).values())
        if not model:
            return False
        for v in model:
            alias = v.getVariable().getAlias()
            if 'STACK' not in alias:
                if alias in regs and alias not in refind_dict:
                    refind_dict[alias] = v.getValue()
                else:
                    return False
        return True

def _try_write_gadgets(gadgets, candidates_list, solves, regs, ctx, chains, fwd_level, avoid_char=None):
    """Try to solve write gadgets with increasing forwarding tolerance.

    fwd_level controls how much forwarding is allowed:
      0 = no forwarding (both addr and val must resolve without reg-to-reg)
      1 = one side can need reg-to-reg forwarding (the other must be direct/const)
      2 = both sides can need reg-to-reg forwarding
    """
    for gadget in candidates_list:
        # Only use gadgets that end with ret
        if gadget.end_type != TYPE_RETURN:
            continue
        if not gadget.is_asted:
            gadget.buildAst()
        for addr, val in list(solves.items()):
            mem_ast = gadget.memory_write_ast[0]
            if mem_ast[1].getBitvectorSize() != 64:
                break

            refind_dict_addr = {}
            if not _resolve_write_operand(ctx, mem_ast[0], addr, regs, refind_dict_addr):
                break
            refind_dict_val = {}
            if not _resolve_write_operand(ctx, mem_ast[1], val, regs, refind_dict_val):
                break

            # Count how many sides need reg-to-reg forwarding
            addr_fwd = any(isinstance(v, str) for v in refind_dict_addr.values())
            val_fwd = any(isinstance(v, str) for v in refind_dict_val.values())
            fwd_count = int(addr_fwd) + int(val_fwd)
            if fwd_count > fwd_level:
                break

            refind_dict = {**refind_dict_addr, **refind_dict_val}
            result = True
            if refind_dict:
                # Protect register operands from being clobbered by the
                # refind solve — but only when the write gadget reads
                # them directly.  When a side is forwarded (e.g. rbx →
                # rdx), the forwarding gadget captures the value before
                # any clobber (guaranteed by defined_regs), and the
                # write gadget uses the forwarded register, so the
                # original source register doesn't need protection.
                keep = set()
                if isinstance(addr, str) and addr in regs and not addr_fwd:
                    keep.add(addr)
                if isinstance(val, str) and val in regs and not val_fwd:
                    keep.add(val)
                result = solveGadgets(gadgets[:], refind_dict, avoid_char=avoid_char, keep_regs=keep)
            if result:
                del solves[addr]
                chain = Chain()
                chain.set_solved(gadget, [result] if isinstance(result, (list, RopChain)) else [])
                chains.insert_chain(chain)
                if not solves:
                    return True
    return False

def solveWriteGadgets(gadgets, solves, avoid_char=None):
    # Work on a copy so partial failures don't corrupt the caller's dict
    solves = dict(solves)

    regs = ["rax", "rbx", "rcx", "rdx", "rsi", "rdi", "r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15"]
    candidates = findCandidatesWriteGadgets(gadgets[:], avoid_char=avoid_char)
    ctx = initialize()
    gwr = list(candidates.keys())
    chains = RopChain()
    gwr.sort()

    # Progressive passes with increasing forwarding tolerance:
    #   0: no forwarding (both sides direct/const-solvable)
    #   1: one side can need reg-to-reg forwarding
    #   2: both sides can need reg-to-reg forwarding
    for level in range(3):
        if not solves:
            break
        for w in gwr:
            if _try_write_gadgets(gadgets, candidates[w], solves, regs, ctx, chains, fwd_level=level, avoid_char=avoid_char):
                return chains

def findStackShift(gadgets, shift_bytes, avoid_char=None):
    """Find gadgets that shift RSP by exactly shift_bytes before returning.

    A shift gadget consumes shift_bytes of stack space beyond its own
    address slot, e.g. 'add rsp, 0x28 ; ret' has diff_sp=0x28.

    Rejects gadgets using 32-bit stack operations (esp) since those
    zero-extend and destroy the upper 32 bits of RSP.

    Returns list of Gadget objects sorted by (side_effect_score, written_regs count).
    """
    candidates = []
    for gadget in gadgets:
        if gadget.end_type != TYPE_RETURN:
            continue
        if gadget.diff_sp != shift_bytes:
            continue
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        # Reject 32-bit stack ops: 'add esp', 'lea esp', 'sub esp' etc.
        # These zero-extend RSP, destroying the upper 32 bits.
        if ' esp' in gadget.insstr:
            continue
        candidates.append(gadget)
    candidates.sort(key=lambda g: (g.side_effect_score, len(g.written_regs)))
    return candidates


def findPivotForReg(gadgets, src_reg, avoid_char=None):
    """Find pivot gadgets that redirect rsp from a specific register.

    Only accepts gadgets ending with ret. Gadgets ending with jmp/call
    to a constant address are excluded (JOP chaining not yet supported).

    Returns list of (gadget, offset, is_indirect) tuples, sorted by
    preference: direct offset=0 first, then small offsets, then indirect.
    """
    candidates = []
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if gadget.end_type != TYPE_RETURN:
            continue
        if gadget.pivot and getattr(gadget, 'pivot_src_reg', None) == src_reg:
            is_indirect = bool(getattr(gadget, 'pivot_indirect', 0))
            candidates.append((gadget, getattr(gadget, 'pivot_offset', 0), is_indirect))
    candidates.sort(key=lambda x: (x[0].side_effect_score, x[2], abs(x[1])))
    return candidates

def _parse_reg_mem_var(ast_str, regs):
    """Parse a REG memory variable alias from an AST string.

    Looks for aliases like 'RDI0', 'RSI3' etc. that indicate
    a value was loaded from a symbolized memory region.

    Returns (src_reg, slot) if found, e.g. ('rdi', 0) for 'RDI0'.
    Returns (None, 0) if no REG memory variable is found.
    """
    s = ast_str.strip()
    for reg in regs:
        prefix = reg.upper()
        if s.startswith(prefix) and s[len(prefix):].isdigit():
            return reg, int(s[len(prefix):])
    return None, 0


def _analyze_jop_dep(gadget, reg_name, regs):
    """Parse a gadget's AST string for a register to find its dependency.

    Uses regAst_str (survives pickle) so buildAst() is not needed.

    Returns ('reg', dep_reg, offset) if value = dep_reg + offset,
            ('mem', dep_reg, slot) if value loaded from [dep_reg + slot*8],
            or None if unparseable.
    """
    ast_str = gadget.regAst_str.get(reg_name)
    if ast_str is None:
        return None
    reg, off = _extract_reg_offset(ast_str)
    if reg:
        return ('reg', reg, off)
    mem_reg, slot = _parse_reg_mem_var(ast_str, regs)
    if mem_reg:
        return ('mem', mem_reg, slot)
    return None

def _analyze_jop_dispatch(gadget, regs):
    """Parse a JOP gadget's dispatch (end_ast) dependency.

    Uses end_ast_str (survives pickle) so buildAst() is not needed.

    Returns ('reg', dep_reg, offset) for JMP/CALL [dep_reg+offset],
            ('mem', dep_reg, slot) for JMP/CALL reg where reg==[dep_reg+slot*8],
            or None if unparseable.
    """
    end_ast_str = gadget.end_ast_str
    if end_ast_str is None:
        return None
    if gadget.end_type in (TYPE_JMP_MEM, TYPE_CALL_MEM):
        reg, off = _extract_reg_offset(end_ast_str)
        if reg:
            return ('reg', reg, off)
    elif gadget.end_type in (TYPE_JMP_REG, TYPE_CALL_REG):
        mem_reg, slot = _parse_reg_mem_var(end_ast_str, regs)
        if mem_reg:
            return ('mem', mem_reg, slot)
    return None

def _resolve_offset(dep_info, reg_values):
    """Resolve a dependency tuple to an absolute offset from src_reg.

    dep_info: ('reg', dep_reg, offset) or ('mem', dep_reg, slot)
    reg_values: dict mapping register -> offset_from_src_reg

    Returns (abs_offset, is_mem) or None if dep_reg not in reg_values.
    """
    kind, dep_reg, val = dep_info
    if dep_reg not in reg_values:
        return None
    if kind == 'reg':
        return (reg_values[dep_reg] + val, False)
    else:  # 'mem'
        return (reg_values[dep_reg] + val * 8, True)

def _build_jop_index(jop_gadgets, regs):
    """Pre-analyze JOP gadgets and build lookup indices.

    Returns (by_written_reg, analyzed) where:
        by_written_reg: dict mapping reg -> list of (gadget, val_dep, disp_dep)
        analyzed: total count of gadgets with parseable deps
    """
    by_reg = {r: [] for r in regs}
    count = 0
    for gadget in jop_gadgets:
        disp_dep = _analyze_jop_dispatch(gadget, regs)
        if disp_dep is None:
            continue
        for reg in gadget.written_regs:
            val_dep = _analyze_jop_dep(gadget, reg, regs)
            if val_dep is None:
                continue
            # Skip identity writes (e.g. "and ah, ah" where rax_out == rax_in).
            # These don't actually change the register and add useless chain steps.
            if val_dep[0] == 'reg' and val_dep[1] == reg and val_dep[2] == 0:
                continue
            by_reg[reg].append((gadget, val_dep, disp_dep))
        count += 1
    # Sort: prefer fewer unique dep registers (simpler chains), then by opcode length
    for reg in by_reg:
        by_reg[reg].sort(key=lambda x: (len({x[1][1], x[2][1]}), len(x[0].insns)))
    return by_reg, count


def _find_jop_chain(jop_index, src_reg, target_reg, regs,
                     reg_values=None, avoid_char=None,
                     visited=None, used_dispatch=None,
                     depth=0, max_depth=3, require_direct=False):
    """Recursively find a chain of JOP gadgets that sets target_reg from src_reg.

    Works backwards: finds a JOP gadget that writes target_reg, then recurses
    to satisfy that gadget's own register dependencies.

    jop_index: dict mapping reg -> list of (gadget, val_dep, disp_dep),
               built by _build_jop_index.
    reg_values: dict mapping register -> offset_from_src_reg for registers
                whose value is known. Initially {src_reg: 0}.
    used_dispatch: dict mapping dispatch_offset -> target_addr for slots
                already claimed by earlier steps. Prevents collisions where
                two steps need different values at the same memory slot.
    require_direct: if True, only accept chains where the final target_reg
                value is a direct offset (is_mem=False), not a memory load.

    Returns (steps, value_offset, is_mem) or None.
        steps: list of (gadget, dispatch_offset_from_src) from entry to last
        value_offset: offset of target_reg's final value from src_reg
        is_mem: True if target_reg is loaded from memory (pointer at that offset)
    """
    if reg_values is None:
        reg_values = {src_reg: 0}
    if visited is None:
        visited = set()
    if used_dispatch is None:
        used_dispatch = {}
    if depth >= max_depth:
        return None

    for gadget, val_dep, disp_dep in jop_index.get(target_reg, []):
        if gadget.addr in visited:
            continue

        # Collect unsatisfied register dependencies
        all_dep_regs = {val_dep[1], disp_dep[1]}
        unsatisfied = all_dep_regs - set(reg_values.keys())

        if not unsatisfied:
            # Base case: all deps known — compute offsets
            val_result = _resolve_offset(val_dep, reg_values)
            disp_result = _resolve_offset(disp_dep, reg_values)
            if val_result is None or disp_result is None:
                continue
            val_offset, val_is_mem = val_result
            disp_offset, _ = disp_result
            if val_offset < 0 or disp_offset < 0:
                continue
            if require_direct and val_is_mem:
                continue  # caller wants direct offset, not memory load
            # Check dispatch collision: this step's dispatch slot
            # will be filled later (by the caller), but check that
            # the slot isn't already claimed for a different purpose
            if disp_offset in used_dispatch:
                continue  # slot already taken by another step
            return ([(gadget, disp_offset)], val_offset, val_is_mem)
        else:
            # Recursive case: find preceding JOP(s) to satisfy deps.
            new_visited = visited | {gadget.addr}
            new_reg_values = dict(reg_values)
            new_used_dispatch = dict(used_dispatch)
            all_steps = []
            all_ok = True

            for dep_reg in unsatisfied:
                if dep_reg in new_reg_values:
                    continue  # already resolved by a prior iteration
                sub_result = _find_jop_chain(
                    jop_index, src_reg, dep_reg, regs,
                    reg_values=new_reg_values, avoid_char=avoid_char,
                    visited=new_visited, used_dispatch=dict(new_used_dispatch),
                    depth=depth+1, max_depth=max_depth
                )
                if sub_result is None:
                    all_ok = False
                    break
                sub_steps, dep_value_offset, dep_is_mem = sub_result
                if dep_is_mem:
                    # Can't propagate through memory loads for register substitution
                    all_ok = False
                    break
                all_steps.extend(sub_steps)
                new_reg_values[dep_reg] = dep_value_offset
                new_visited.update(s[0].addr for s in sub_steps)
                # Track dispatch offsets and register clobbers from sub-chain
                for sg, soff in sub_steps:
                    new_used_dispatch[soff] = sg.addr
                    # Invalidate registers clobbered by this gadget.
                    # The target dep_reg was just set; other written_regs
                    # are side effects (e.g. pop rbx) that destroy prior values.
                    for clobbered in sg.written_regs:
                        if clobbered != dep_reg and clobbered in new_reg_values:
                            del new_reg_values[clobbered]

            if not all_ok:
                continue

            # Compute offsets with updated reg_values
            val_result = _resolve_offset(val_dep, new_reg_values)
            disp_result = _resolve_offset(disp_dep, new_reg_values)
            if val_result is None or disp_result is None:
                continue
            val_offset, val_is_mem = val_result
            disp_offset, _ = disp_result
            if val_offset < 0 or disp_offset < 0:
                continue
            if require_direct and val_is_mem:
                continue
            # Check dispatch collision for this step
            if disp_offset in new_used_dispatch:
                continue
            all_steps.append((gadget, disp_offset))
            return (all_steps, val_offset, val_is_mem)

    return None


def findJopPivotCandidates(gadgets, src_reg, avoid_char=None, used_dispatch=None):
    """Find JOP gadget chains that can pivot rsp from src_reg.

    Uses recursive search to find chains of arbitrary depth:
    e.g., JOP1 -> JOP2 -> pivot, where JOP1 sets a register that JOP2
    needs, and JOP2 sets the register that the pivot needs.

    Returns list of (jop_steps, pivot_gadget, chain_offset, jop_indirect) tuples.
        jop_steps: list of (gadget, dispatch_offset) from entry to last JOP
    """
    regs = ["rax", "rbx", "rcx", "rdx", "rsi", "rdi", "rbp",
            "r8", "r9", "r10", "r11", "r12", "r13", "r14", "r15"]

    # Collect all ret-ending pivot gadgets (any pivot_src_reg)
    ret_pivots = []
    stack_pivots = []  # STACK_N pivots: (gadget, slot)
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if gadget.end_type != TYPE_RETURN:
            continue
        if gadget.pivot:
            if getattr(gadget, 'pivot_src_reg', None) is not None:
                ret_pivots.append(gadget)
            elif getattr(gadget, 'pivot_stack_slot', None) is not None:
                if gadget.side_effect_score == 0:
                    stack_pivots.append((gadget, gadget.pivot_stack_slot))

    if not ret_pivots and not stack_pivots:
        return []

    # Collect usable JOP gadgets and build index
    jop_gadgets = []
    for gadget in gadgets:
        if avoid_char and _has_badchar(gadget.addr, avoid_char):
            continue
        if gadget.is_memory_write:
            continue
        if gadget.end_type not in (TYPE_JMP_MEM, TYPE_CALL_MEM, TYPE_JMP_REG, TYPE_CALL_REG):
            continue
        jop_gadgets.append(gadget)

    jop_index, _ = _build_jop_index(jop_gadgets, regs)

    results = []

    # Group pivots by target register to avoid redundant searches
    pivots_by_reg = {}
    for pivot_gadget in ret_pivots:
        reg = pivot_gadget.pivot_src_reg
        if reg not in pivots_by_reg:
            pivots_by_reg[reg] = []
        pivots_by_reg[reg].append(pivot_gadget)

    # Search per unique target register: try direct (non-indirect) first, then any.
    # This ensures both jop (inline chain) and jop_indirect (pointer) results
    # are returned when available.
    for target_reg, pivot_list in pivots_by_reg.items():
        seen_steps = set()  # deduplicate by entry gadget address
        for require_direct in (True, False):
            chain_result = _find_jop_chain(
                jop_index, src_reg, target_reg, regs,
                avoid_char=avoid_char, used_dispatch=dict(used_dispatch) if used_dispatch else None,
                require_direct=require_direct
            )
            if chain_result is None:
                continue
            steps, value_offset, is_mem = chain_result
            # Reject indirect results where the chain pointer slot
            # collides with a dispatch slot.  This happens when the JOP
            # gadget uses the same register for both dispatch and value
            # (e.g., `mov rax, [rdi+8]; call rax` where the pivot reads
            # rax).  The slot holds the dispatch address at runtime, so
            # it can't simultaneously be a chain pointer.
            if is_mem:
                dispatch_offsets = {off for _, off in steps}
                if value_offset in dispatch_offsets:
                    continue
            # Deduplicate: skip if same entry gadget already found
            entry_key = tuple(g.addr for g, _ in steps)
            if entry_key in seen_steps:
                continue
            seen_steps.add(entry_key)
            for pivot_gadget in pivot_list:
                pivot_off = getattr(pivot_gadget, 'pivot_offset', 0)
                if is_mem:
                    # Indirect: value_offset is the pointer slot in the
                    # object.  pivot_offset affects the chain buffer
                    # layout (padding before first gadget), not the
                    # object layout.
                    chain_offset = value_offset
                else:
                    chain_offset = value_offset + pivot_off
                if chain_offset < 0:
                    continue
                results.append((steps, pivot_gadget, chain_offset, is_mem, None))

    # Stack-push pivots: step 1 pushes a register, pivot pops it into RSP.
    if stack_pivots:
        # Collect JOP gadgets that push GP regs (allow memory writes from push)
        push_jop_gadgets = []
        for gadget in gadgets:
            if avoid_char and _has_badchar(gadget.addr, avoid_char):
                continue
            srw = getattr(gadget, 'stack_reg_writes', {})
            if not srw:
                continue
            if gadget.end_type not in (TYPE_JMP_MEM, TYPE_CALL_MEM, TYPE_JMP_REG, TYPE_CALL_REG):
                continue
            push_jop_gadgets.append(gadget)

        for push_gadget in push_jop_gadgets:
            srw = push_gadget.stack_reg_writes
            disp_dep = _analyze_jop_dispatch(push_gadget, regs)
            if disp_dep is None:
                continue

            for pivot_gadget, pivot_slot in stack_pivots:
                if pivot_slot not in srw:
                    continue
                pushed_reg, push_offset = srw[pivot_slot]

                # Pushed value must come from src_reg for the pivot to be useful
                if pushed_reg != src_reg:
                    continue

                # Resolve dispatch offset from src_reg
                disp_result = _resolve_offset(disp_dep, {src_reg: 0})
                if disp_result is None: