fix(compaction): harden summarization and truncation behavior

Tom-Ryder · Tom-Ryder · commit fc636ee9ad22 · 2026-03-31T08:51:02.000-07:00
diff --git a/Sources/AgentRunKit/Core/Agent.swift b/Sources/AgentRunKit/Core/Agent.swift
@@ -144,7 +144,7 @@ extension Agent {
         var totalUsage = TokenUsage()
         var lastTotalTokens: Int?
         var sessionAllowlist: Set<String> = []
-        let compactor = ContextCompactor(
+        var compactor = ContextCompactor(
             client: client, toolDefinitions: toolDefinitions, configuration: configuration
         )
         var budgetPhase = try makeBudgetPhase()
@@ -266,7 +266,7 @@ private extension Agent {
         var sessionAllowlist: Set<String> = []
         let policy = StreamPolicy.agent
         let processor = StreamProcessor(client: client, toolDefinitions: toolDefinitions, policy: policy)
-        let compactor = ContextCompactor(
+        var compactor = ContextCompactor(
             client: client, toolDefinitions: toolDefinitions, configuration: configuration
         )
         var budgetPhase = try makeBudgetPhase()
diff --git a/Sources/AgentRunKit/Core/ContextCompactor.swift b/Sources/AgentRunKit/Core/ContextCompactor.swift
@@ -5,11 +5,20 @@ struct ContextCompactor {
     let toolDefinitions: [ToolDefinition]
     let configuration: AgentConfiguration
 
+    init(client: any LLMClient, toolDefinitions: [ToolDefinition], configuration: AgentConfiguration) {
+        self.client = client
+        self.toolDefinitions = toolDefinitions
+        self.configuration = configuration
+    }
+
     private static let minimumPruningReduction = 0.2
     private static let pruningPreviewLength = 80
+    private static let maxConsecutiveSummarizationFailures = 3
+
+    private var consecutiveSummarizationFailures = 0
 
     @discardableResult
-    func compactOrTruncateIfNeeded(
+    mutating func compactOrTruncateIfNeeded(
         _ messages: inout [ChatMessage],
         lastTotalTokens: Int?,
         totalUsage: inout TokenUsage
@@ -26,15 +35,23 @@ struct ContextCompactor {
         let (pruned, reductionRatio) = pruneObservations(messages)
         if reductionRatio > Self.minimumPruningReduction {
             messages = pruned
+            consecutiveSummarizationFailures = 0
             return true
         }
 
+        guard consecutiveSummarizationFailures < Self.maxConsecutiveSummarizationFailures else {
+            truncateIfNeeded(&messages)
+            return false
+        }
+
         do {
             let (compacted, compactionUsage) = try await summarize(pruned)
             messages = compacted
             totalUsage += compactionUsage
+            consecutiveSummarizationFailures = 0
             return true
         } catch {
+            consecutiveSummarizationFailures += 1
             truncateIfNeeded(&messages)
             return false
         }
@@ -82,7 +99,8 @@ struct ContextCompactor {
         let taskContext = extractTaskContext(messages)
         let recentContext = extractRecentContext(messages)
 
-        let summaryRequest = messages + [.user(configuration.compactionPrompt ?? Self.summarizationPrompt)]
+        let prompt = configuration.compactionPrompt ?? Self.summarizationPrompt
+        let summaryRequest = Self.stripMedia(messages) + [.user(prompt)]
         let response = try await client.generate(
             messages: summaryRequest, tools: toolDefinitions, responseFormat: nil, requestContext: nil
         )
@@ -104,8 +122,9 @@ struct ContextCompactor {
               content.count > max else { return content }
         let marker = "\n\n...[truncated]...\n\n"
         let contentBudget = Swift.max(max - marker.count, 0)
-        let half = contentBudget / 2
-        return "\(content.prefix(half))\(marker)\(content.suffix(half))"
+        let headBudget = contentBudget * 3 / 5
+        let tailBudget = contentBudget - headBudget
+        return "\(content.prefix(headBudget))\(marker)\(content.suffix(tailBudget))"
     }
 
     private func truncateIfNeeded(_ messages: inout [ChatMessage]) {
@@ -115,6 +134,22 @@ struct ContextCompactor {
 }
 
 private extension ContextCompactor {
+    static func stripMedia(_ messages: [ChatMessage]) -> [ChatMessage] {
+        messages.map { message in
+            guard case let .userMultimodal(parts) = message else { return message }
+            let stripped = parts.map { part -> ContentPart in
+                switch part {
+                case .text: return part
+                case .imageURL, .imageBase64: return .text("[image]")
+                case .videoBase64: return .text("[video]")
+                case .pdfBase64: return .text("[PDF]")
+                case .audioBase64: return .text("[audio]")
+                }
+            }
+            return .userMultimodal(stripped)
+        }
+    }
+
     func extractTaskContext(_ messages: [ChatMessage]) -> [ChatMessage] {
         var context: [ChatMessage] = []
         for message in messages {
diff --git a/Tests/AgentRunKitTests/ContextCompactionTests.swift b/Tests/AgentRunKitTests/ContextCompactionTests.swift
@@ -9,6 +9,7 @@ private actor CompactionMockLLMClient: LLMClient {
     private let responses: [AssistantMessage]
     private var callIndex: Int = 0
     private(set) var allCapturedMessages: [[ChatMessage]] = []
+    private(set) var generateCallCount: Int = 0
     private let failSummarization: Bool
 
     init(
@@ -25,6 +26,7 @@ private actor CompactionMockLLMClient: LLMClient {
         messages: [ChatMessage], tools _: [ToolDefinition],
         responseFormat _: ResponseFormat?, requestContext _: RequestContext?
     ) async throws -> AssistantMessage {
+        generateCallCount += 1
         if failSummarization, case let .user(text) = messages.last,
            text.contains("CONTEXT CHECKPOINT") {
             throw AgentError.llmError(.other("Summarization failed"))
@@ -269,6 +271,120 @@ struct CompactionTriggerTests {
 // MARK: - Compaction Fallback Tests
 
 struct CompactionFallbackTests {
+    @Test
+    func circuitBreakerSkipsSummarizationAfterConsecutiveFailures() async {
+        let client = CompactionMockLLMClient(
+            responses: [], contextWindowSize: 1000, failSummarization: true
+        )
+        var compactor = ContextCompactor(
+            client: client,
+            toolDefinitions: [],
+            configuration: AgentConfiguration(maxMessages: 20, compactionThreshold: 0.5)
+        )
+        var messages: [ChatMessage] = [
+            .user("Hello"),
+            .assistant(AssistantMessage(content: "", toolCalls: [
+                ToolCall(id: "call_1", name: "search", arguments: "{}"),
+            ])),
+            .tool(id: "call_1", name: "search", content: String(repeating: "x", count: 10)),
+            .assistant(AssistantMessage(content: "Done")),
+        ]
+        var usage = TokenUsage()
+
+        for _ in 0 ..< 3 {
+            await compactor.compactOrTruncateIfNeeded(
+                &messages, lastTotalTokens: 900, totalUsage: &usage
+            )
+        }
+        let callsAfterTripping = await client.generateCallCount
+        #expect(callsAfterTripping == 3)
+
+        await compactor.compactOrTruncateIfNeeded(
+            &messages, lastTotalTokens: 900, totalUsage: &usage
+        )
+        let callsAfterSkip = await client.generateCallCount
+        #expect(callsAfterSkip == 3)
+    }
+
+    @Test
+    func circuitBreakerResetsOnSuccess() async {
+        var compactor = ContextCompactor(
+            client: CompactionMockLLMClient(
+                responses: [
+                    AssistantMessage(content: "Summary.", tokenUsage: TokenUsage(input: 50, output: 100)),
+                ],
+                contextWindowSize: 1000, failSummarization: false
+            ),
+            toolDefinitions: [],
+            configuration: AgentConfiguration(compactionThreshold: 0.5)
+        )
+        var messages: [ChatMessage] = [
+            .user("Hello"),
+            .assistant(AssistantMessage(content: "Done")),
+        ]
+        var usage = TokenUsage()
+
+        let result = await compactor.compactOrTruncateIfNeeded(
+            &messages, lastTotalTokens: 900, totalUsage: &usage
+        )
+        #expect(result)
+        #expect(hasBridge(messages))
+    }
+
+    @Test
+    func circuitBreakerResetsAfterPruningSuccess() async {
+        let client = CompactionMockLLMClient(
+            responses: [], contextWindowSize: 1000, failSummarization: true
+        )
+        var compactor = ContextCompactor(
+            client: client,
+            toolDefinitions: [],
+            configuration: AgentConfiguration(maxMessages: 20, compactionThreshold: 0.5)
+        )
+        var summarizationMessages: [ChatMessage] = [
+            .user("Hello"),
+            .assistant(AssistantMessage(content: "", toolCalls: [
+                ToolCall(id: "call_1", name: "search", arguments: "{}"),
+            ])),
+            .tool(id: "call_1", name: "search", content: String(repeating: "x", count: 10)),
+            .assistant(AssistantMessage(content: "Done")),
+        ]
+        var pruningMessages: [ChatMessage] = [
+            .user("Hello"),
+            .assistant(AssistantMessage(content: "", toolCalls: [
+                ToolCall(id: "call_2", name: "read_file", arguments: "{}"),
+            ])),
+            .tool(id: "call_2", name: "read_file", content: String(repeating: "x", count: 5000)),
+            .assistant(AssistantMessage(content: "Done")),
+        ]
+        var usage = TokenUsage()
+
+        for _ in 0 ..< 2 {
+            await compactor.compactOrTruncateIfNeeded(
+                &summarizationMessages, lastTotalTokens: 900, totalUsage: &usage
+            )
+        }
+        #expect(await client.generateCallCount == 2)
+
+        let pruned = await compactor.compactOrTruncateIfNeeded(
+            &pruningMessages, lastTotalTokens: 900, totalUsage: &usage
+        )
+        #expect(pruned)
+        #expect(await client.generateCallCount == 2)
+
+        for _ in 0 ..< 3 {
+            await compactor.compactOrTruncateIfNeeded(
+                &summarizationMessages, lastTotalTokens: 900, totalUsage: &usage
+            )
+        }
+        #expect(await client.generateCallCount == 5)
+
+        await compactor.compactOrTruncateIfNeeded(
+            &summarizationMessages, lastTotalTokens: 900, totalUsage: &usage
+        )
+        #expect(await client.generateCallCount == 5)
+    }
+
     @Test
     func compactionFallsBackToTruncationOnError() async throws {
         let client = CompactionMockLLMClient(
@@ -527,6 +643,67 @@ struct ObservationPruningTests {
     }
 }
 
+// MARK: - Media Stripping Tests
+
+struct MediaStrippingTests {
+    @Test
+    func summarizationStripsMediaFromMultimodalMessages() async throws {
+        let client = CompactionMockLLMClient(
+            responses: [
+                AssistantMessage(content: "Summary.", tokenUsage: TokenUsage(input: 50, output: 100)),
+            ]
+        )
+        let compactor = ContextCompactor(
+            client: client, toolDefinitions: [], configuration: AgentConfiguration()
+        )
+        let messages: [ChatMessage] = [
+            .user([
+                .text("Describe this"),
+                .image(data: Data(repeating: 0xFF, count: 1000), mimeType: "image/png"),
+                .audio(data: Data(repeating: 0xAA, count: 500), format: .mp3),
+                .video(data: Data(repeating: 0xBB, count: 500), mimeType: "video/mp4"),
+                .pdf(data: Data(repeating: 0xCC, count: 500)),
+            ]),
+            .assistant(AssistantMessage(content: "I see an image.")),
+        ]
+        _ = try await compactor.summarize(messages)
+
+        let captured = await client.allCapturedMessages
+        guard case let .userMultimodal(parts) = captured[0][0] else {
+            Issue.record("Expected userMultimodal"); return
+        }
+        #expect(parts.count == 5)
+        #expect(parts.allSatisfy { if case .text = $0 { true } else { false } })
+        #expect(parts.contains { if case let .text(text) = $0 { text == "[image]" } else { false } })
+        #expect(parts.contains { if case let .text(text) = $0 { text == "[audio]" } else { false } })
+        #expect(parts.contains { if case let .text(text) = $0 { text == "[video]" } else { false } })
+        #expect(parts.contains { if case let .text(text) = $0 { text == "[PDF]" } else { false } })
+    }
+
+    @Test
+    func summarizationPreservesTextOnlyMessages() async throws {
+        let client = CompactionMockLLMClient(
+            responses: [
+                AssistantMessage(content: "Summary.", tokenUsage: TokenUsage(input: 50, output: 100)),
+            ]
+        )
+        let compactor = ContextCompactor(
+            client: client, toolDefinitions: [], configuration: AgentConfiguration()
+        )
+        let messages: [ChatMessage] = [
+            .user("Plain text message"),
+            .assistant(AssistantMessage(content: "Response")),
+        ]
+        _ = try await compactor.summarize(messages)
+
+        let captured = await client.allCapturedMessages
+        guard case let .user(text) = captured[0][0] else {
+            Issue.record("Expected user string message"); return
+        }
+        #expect(text == "Plain text message")
+    }
+}
+
 // MARK: - Tool Result Truncation Tests
 
 struct ToolResultTruncationTests {
@@ -578,8 +755,8 @@ struct ToolResultTruncationTests {
             + String(repeating: "Z", count: 100)
         let config = AgentConfiguration(maxToolResultCharacters: 60)
         let truncated = ContextCompactor.truncateToolResult(content, configuration: config)
-        #expect(truncated.hasPrefix(String(repeating: "A", count: 19)))
-        #expect(truncated.hasSuffix(String(repeating: "Z", count: 19)))
+        #expect(truncated.hasPrefix(String(repeating: "A", count: 22)))
+        #expect(truncated.hasSuffix(String(repeating: "Z", count: 16)))
         #expect(truncated.count <= 60)
         #expect(truncated.contains("truncated"))
     }