feat: add buildTool factory, cost tracker, context compaction, expanded hooks

shreyas-lyzr · claude · shreyas-lyzr · commit 814e61786eae · 2026-04-03T04:08:22.000-04:00
Applies Claude Code architecture patterns to GitClaw:
- buildTool() factory with fail-closed defaults (isConcurrencySafe, isReadOnly, isDestructive)
- CostTracker class for per-model token usage and cost tracking across sessions
- Context compaction utilities (token estimation, tool result truncation, summarization prompts)
- 3 new hook events: pre_query, post_tool_failure, file_changed
- Query.costs() method returns session cost breakdown
- All new modules exported from SDK

Co-Authored-By: Claude Opus 4.6 (1M context) &lt;noreply@anthropic.com&gt;
diff --git a/package.json b/package.json
@@ -1,6 +1,6 @@
 {
   "name": "gitclaw",
-  "version": "1.1.9",
+  "version": "1.2.0",
   "description": "A universal git-native multimodal always learning AI Agent (TinyHuman)",
   "author": "shreyaskapale",
   "license": "MIT",
diff --git a/src/compact.ts b/src/compact.ts
@@ -0,0 +1,110 @@
+import type { GCMessage } from "./sdk-types.js";
+
+// ── Token estimation ──────────────────────────────────────────────────
+
+/** Rough token estimate: 1 token ≈ 4 chars */
+export function estimateTokens(text: string): number {
+	return Math.ceil(text.length / 4);
+}
+
+/** Estimate total tokens across a message array */
+export function estimateMessageTokens(messages: GCMessage[]): number {
+	let total = 0;
+	for (const msg of messages) {
+		switch (msg.type) {
+			case "assistant":
+				total += estimateTokens(msg.content) + estimateTokens(msg.thinking ?? "");
+				break;
+			case "user":
+				total += estimateTokens(msg.content);
+				break;
+			case "tool_use":
+				total += estimateTokens(JSON.stringify(msg.args)) + 50;
+				break;
+			case "tool_result":
+				total += estimateTokens(msg.content);
+				break;
+			case "delta":
+				total += estimateTokens(msg.content);
+				break;
+			case "system":
+				total += estimateTokens(msg.content);
+				break;
+		}
+	}
+	return total;
+}
+
+// ── Compaction checks ─────────────────────────────────────────────────
+
+/** Check if messages are approaching context limit and need compaction */
+export function needsCompaction(
+	messages: GCMessage[],
+	contextWindow: number = 200000,
+): { needed: boolean; tokenEstimate: number; ratio: number } {
+	const tokenEstimate = estimateMessageTokens(messages);
+	const ratio = tokenEstimate / contextWindow;
+	return { needed: ratio > 0.75, tokenEstimate, ratio };
+}
+
+// ── Tool result truncation ────────────────────────────────────────────
+
+/** Truncate oversized tool results, keeping first and last portions */
+export function truncateToolResults(
+	messages: GCMessage[],
+	maxCharsPerResult: number = 10000,
+): GCMessage[] {
+	return messages.map((msg) => {
+		if (msg.type === "tool_result" && msg.content.length > maxCharsPerResult) {
+			const half = Math.floor(maxCharsPerResult / 2);
+			const truncated =
+				msg.content.slice(0, half) +
+				`\n\n... [${msg.content.length - maxCharsPerResult} chars truncated] ...\n\n` +
+				msg.content.slice(-half);
+			return { ...msg, content: truncated };
+		}
+		return msg;
+	});
+}
+
+// ── Conversation summarization ────────────────────────────────────────
+
+/**
+ * Build a text representation of messages for summarization.
+ * Strips deltas and system messages, keeps the substantive conversation.
+ */
+export function messagesToText(messages: GCMessage[]): string {
+	const parts: string[] = [];
+	for (const msg of messages) {
+		switch (msg.type) {
+			case "assistant":
+				parts.push(`Assistant: ${msg.content}`);
+				break;
+			case "user":
+				parts.push(`User: ${msg.content}`);
+				break;
+			case "tool_use":
+				parts.push(`Tool call: ${msg.toolName}(${JSON.stringify(msg.args).slice(0, 200)})`);
+				break;
+			case "tool_result":
+				parts.push(`Tool result [${msg.toolName}]: ${msg.content.slice(0, 500)}`);
+				break;
+		}
+	}
+	return parts.join("\n");
+}
+
+/**
+ * Generate a compaction prompt that can be sent to the model to summarize
+ * the conversation so far. The caller runs the actual query.
+ */
+export function buildCompactPrompt(messages: GCMessage[]): string {
+	const text = messagesToText(messages);
+	if (!text) return "";
+	return (
+		"Summarize this conversation concisely. Preserve key decisions, " +
+		"file paths, code changes, and outcomes. Omit tool call details " +
+		"unless they failed.\n\n" +
+		text
+	);
+}
diff --git a/src/cost-tracker.ts b/src/cost-tracker.ts
@@ -0,0 +1,94 @@
+// ── Per-model cost and token tracking ──────────────────────────────────
+
+export interface ModelUsage {
+	inputTokens: number;
+	outputTokens: number;
+	cacheReadTokens: number;
+	cacheWriteTokens: number;
+	totalTokens: number;
+	costUsd: number;
+	requests: number;
+}
+
+export interface SessionCosts {
+	totalCostUsd: number;
+	totalInputTokens: number;
+	totalOutputTokens: number;
+	totalRequests: number;
+	startTime: number;
+	modelUsage: Record<string, ModelUsage>;
+}
+
+/**
+ * Tracks token usage and cost per model across a session.
+ * Mirrors Claude Code's cost-tracker pattern.
+ */
+export class CostTracker {
+	private costs: SessionCosts;
+
+	constructor() {
+		this.costs = {
+			totalCostUsd: 0,
+			totalInputTokens: 0,
+			totalOutputTokens: 0,
+			totalRequests: 0,
+			startTime: Date.now(),
+			modelUsage: {},
+		};
+	}
+
+	add(
+		model: string,
+		usage: {
+			inputTokens: number;
+			outputTokens: number;
+			cacheReadTokens?: number;
+			cacheWriteTokens?: number;
+			totalTokens?: number;
+			costUsd?: number;
+		},
+	): void {
+		this.costs.totalInputTokens += usage.inputTokens;
+		this.costs.totalOutputTokens += usage.outputTokens;
+		this.costs.totalCostUsd += usage.costUsd ?? 0;
+		this.costs.totalRequests++;
+
+		if (!this.costs.modelUsage[model]) {
+			this.costs.modelUsage[model] = {
+				inputTokens: 0,
+				outputTokens: 0,
+				cacheReadTokens: 0,
+				cacheWriteTokens: 0,
+				totalTokens: 0,
+				costUsd: 0,
+				requests: 0,
+			};
+		}
+		const mu = this.costs.modelUsage[model];
+		mu.inputTokens += usage.inputTokens;
+		mu.outputTokens += usage.outputTokens;
+		mu.cacheReadTokens += usage.cacheReadTokens ?? 0;
+		mu.cacheWriteTokens += usage.cacheWriteTokens ?? 0;
+		mu.totalTokens += usage.totalTokens ?? (usage.inputTokens + usage.outputTokens);
+		mu.costUsd += usage.costUsd ?? 0;
+		mu.requests++;
+	}
+
+	get(): SessionCosts {
+		return {
+			...this.costs,
+			modelUsage: { ...this.costs.modelUsage },
+		};
+	}
+
+	reset(): void {
+		this.costs = {
+			totalCostUsd: 0,
+			totalInputTokens: 0,
+			totalOutputTokens: 0,
+			totalRequests: 0,
+			startTime: Date.now(),
+			modelUsage: {},
+		};
+	}
+}
diff --git a/src/exports.ts b/src/exports.ts
@@ -46,5 +46,16 @@ export type { PluginManifest, PluginConfig, LoadedPlugin } from "./plugin-types.
 export type { GitclawPluginApi } from "./plugin-sdk.js";
 export { createPluginApi } from "./plugin-sdk.js";
 
+// Tool factory (Claude Code buildTool pattern)
+export { buildTool, getToolMetadata } from "./tool-factory.js";
+export type { ToolDefinition, ToolMetadata } from "./tool-factory.js";
+
+// Cost tracking
+export { CostTracker } from "./cost-tracker.js";
+export type { SessionCosts, ModelUsage } from "./cost-tracker.js";
+
+// Context compaction
+export { estimateTokens, estimateMessageTokens, needsCompaction, truncateToolResults, messagesToText, buildCompactPrompt } from "./compact.js";
+
 // Loader (escape hatch)
 export { loadAgent } from "./loader.js";
diff --git a/src/hooks.ts b/src/hooks.ts
@@ -15,7 +15,10 @@ export interface HooksConfig {
 	hooks: {
 		on_session_start?: HookDefinition[];
 		pre_tool_use?: HookDefinition[];
+		post_tool_failure?: HookDefinition[];
 		post_response?: HookDefinition[];
+		pre_query?: HookDefinition[];
+		file_changed?: HookDefinition[];
 		on_error?: HookDefinition[];
 	};
 }
diff --git a/src/sdk-types.ts b/src/sdk-types.ts
@@ -1,4 +1,5 @@
 import type { AgentManifest } from "./loader.js";
+import type { SessionCosts } from "./cost-tracker.js";
 
 // ── Message types ──────────────────────────────────────────────────────
 
@@ -64,7 +65,7 @@ export interface GCStreamDelta {
 
 // ── Hook types ─────────────────────────────────────────────────────────
 
-export type GCHookEvent = "SessionStart" | "PreToolUse" | "PostResponse" | "OnError";
+export type GCHookEvent = "SessionStart" | "PreToolUse" | "PostToolFailure" | "PreQuery" | "PostResponse" | "FileChanged" | "OnError";
 
 export interface GCHookContext {
 	sessionId: string;
@@ -87,7 +88,10 @@ export interface GCHookResult {
 export interface GCHooks {
 	onSessionStart?: (ctx: GCHookContext) => Promise<GCHookResult> | GCHookResult;
 	preToolUse?: (ctx: GCPreToolUseContext) => Promise<GCHookResult> | GCHookResult;
+	postToolFailure?: (ctx: GCHookContext & { toolName: string; error: string }) => Promise<void> | void;
+	preQuery?: (ctx: GCHookContext) => Promise<GCHookResult> | GCHookResult;
 	postResponse?: (ctx: GCHookContext) => Promise<void> | void;
+	fileChanged?: (ctx: GCHookContext & { path: string }) => Promise<void> | void;
 	onError?: (ctx: GCHookContext & { error: string }) => Promise<void> | void;
 }
 
@@ -157,4 +161,5 @@ export interface Query extends AsyncGenerator<GCMessage, void, undefined> {
 	sessionId(): string;
 	manifest(): AgentManifest;
 	messages(): GCMessage[];
+	costs(): SessionCosts;
 }
diff --git a/src/sdk.ts b/src/sdk.ts
@@ -22,6 +22,7 @@ import type {
 	QueryOptions,
 	SandboxOptions,
 } from "./sdk-types.js";
+import { CostTracker } from "./cost-tracker.js";
 
 // ── Event channel ──────────────────────────────────────────────────────
 
@@ -82,6 +83,7 @@ export function query(options: QueryOptions): Query {
 	const channel = createChannel<GCMessage>();
 	const collectedMessages: GCMessage[] = [];
 	const ac = options.abortController ?? new AbortController();
+	const costTracker = new CostTracker();
 
 	// These are set once the agent is loaded (async init below)
 	let _sessionId = options.sessionId ?? "";
@@ -358,6 +360,14 @@ export function query(options: QueryOptions): Query {
 					};
 					pushMsg(assistantMsg);
 
+					// Track costs per model
+					if (assistantMsg.usage) {
+						costTracker.add(
+							`${assistantMsg.provider}:${assistantMsg.model}`,
+							assistantMsg.usage,
+						);
+					}
+
 					// Reset accumulators
 					accText = "";
 					accThinking = "";
@@ -487,6 +497,10 @@ export function query(options: QueryOptions): Query {
 			return [...collectedMessages];
 		},
 
+		costs() {
+			return costTracker.get();
+		},
+
 		// AsyncGenerator protocol
 		next() {
 			return channel.pull();
diff --git a/src/tool-factory.ts b/src/tool-factory.ts
@@ -0,0 +1,66 @@
+import type { AgentTool } from "@mariozechner/pi-agent-core";
+import { buildTypeboxSchema } from "./tool-loader.js";
+
+// ── Tool metadata for concurrency, safety, and budget ─────────────────
+
+export interface ToolMetadata {
+	/** Can run in parallel with other concurrent-safe tools. Default: false (fail-closed) */
+	isConcurrencySafe?: boolean;
+	/** Only reads, never writes. Default: false (fail-closed) */
+	isReadOnly?: boolean;
+	/** Irreversible action (delete, send). Default: false */
+	isDestructive?: boolean;
+	/** Truncate result if larger than this. Default: 50000 chars */
+	maxResultSizeChars?: number;
+}
+
+export interface ToolDefinition<T = any> {
+	name: string;
+	description: string;
+	parameters: Record<string, any>;
+	execute: (args: T, signal?: AbortSignal) => Promise<string>;
+	metadata?: ToolMetadata;
+}
+
+const TOOL_DEFAULTS: Required<ToolMetadata> = {
+	isConcurrencySafe: false,
+	isReadOnly: false,
+	isDestructive: false,
+	maxResultSizeChars: 50000,
+};
+
+/**
+ * Build a tool with fail-closed defaults and result truncation.
+ * Mirrors Claude Code's buildTool() pattern.
+ */
+export function buildTool<T = any>(def: ToolDefinition<T>): AgentTool<any> & { metadata: Required<ToolMetadata> } {
+	const metadata: Required<ToolMetadata> = { ...TOOL_DEFAULTS, ...def.metadata };
+	const schema = buildTypeboxSchema(def.parameters);
+
+	return {
+		name: def.name,
+		label: def.name,
+		description: def.description,
+		parameters: schema,
+		metadata,
+		async execute(
+			_toolCallId: string,
+			params: T,
+			signal?: AbortSignal,
+		) {
+			let result = await def.execute(params, signal);
+			if (result.length > metadata.maxResultSizeChars) {
+				result = result.slice(0, metadata.maxResultSizeChars) +
+					`\n\n[Truncated: ${result.length} chars total, showing first ${metadata.maxResultSizeChars}]`;
+			}
+			return { content: [{ type: "text" as const, text: result }], details: undefined };
+		},
+	};
+}
+
+/**
+ * Get metadata for a tool, returning fail-closed defaults if not set.
+ */
+export function getToolMetadata(tool: AgentTool<any>): Required<ToolMetadata> {
+	return (tool as any).metadata ?? { ...TOOL_DEFAULTS };
+}

Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "gitclaw",`
`3`		`- "version": "1.1.9",`
	`3`	`+ "version": "1.2.0",`
`4`	`4`	`"description": "A universal git-native multimodal always learning AI Agent (TinyHuman)",`
`5`	`5`	`"author": "shreyaskapale",`
`6`	`6`	`"license": "MIT",`