Writing

Long-form thinking and short-form musings.

Receipt-Gated Pipelines
Cryptographic Verification of Tool-Call Claims in Multi-Agent LLM Systems

Debate Degrades Reasoning
Single-round debate degrades LLM reasoning in symmetric settings — 2,100 evaluations, 11 conditions, two benchmarks

Structure Beats Scale
How Structured Review Outperforms Brute-Force Generation in LLM Code Synthesis

The Factuality Ladder
April 1, 2026 · 12 min read

Structure Beats Scale
March 11, 2026 · 11 min read

The Only Limit Is Noticing
February 28, 2026 · 9 min read

Stevo's Writing