Building AI agents on Notion. From idea to production in two weeks.

De meeste AI agent demo's sterven in het gat tussen het prototype en de database waar het bedrijf echt op draait. De agent werkt in een notebook, en daarna niet in productie omdat de data in zeven systemen leeft, het schema elke week verschuift en niemand de laag ertussen bezit.

Agents bouwen op Notion sluit dat gat. De agent leest uit dezelfde databases als het team, roept externe tools aan via MCP en de API, en schrijft het resultaat terug in hetzelfde record dat iedereen ziet. De datalaag en de operationele laag zijn één ding. Dat is de unlock.

Wat een Notion agent eigenlijk is

Een Custom Agent in Notion is een configureerbare worker met drie delen. Een trigger - een schema, een database-change of een handmatige run. Een set instructies die het doel, de grenzen en de toegestane tools beschrijven. En een set connecties: de Notion workspaces, externe tools via MCP en API's die de agent mag aanroepen.

De agent draait in een loop. Hij leest, plant, handelt en schrijft terug. De Notion workspace is zijn langetermijngeheugen. De paginageschiedenis is het auditspoor.

Agents on Notion · context in, action out

Always on

READ

CRM · docs · wiki

PLAN

Custom Agent · 20-min runs

ACT

Slack · Gmail · Stripe · API

Lees uit de workspace. Plan in de agent. Handel via externe tools. Schrijf terug naar hetzelfde record. De loop is het operationele model.

Kies de juiste eerste agent

Founders vragen welke agent ze als eerste moeten bouwen. Het eerlijke antwoord is: de agent die veilig faalt. Een eerste agent heeft een acceptabele foutmarge, een human reviewer in de loop, en een meetbare output.

01Inbound lead enrichment. Leest nieuwe rijen in Contacts, verrijkt met publieke data, scoort tegen het ICP, wijst een owner toe.
02Meeting prep. Leest een agenda-item, zoekt het bijbehorende account in Notion, stelt een prep-doc op met context, recente activiteit en drie vragen.
03Renewal radar. Draait wekelijks, vindt accounts met een renewal binnen 90 dagen, rangschikt op risico, post een lijst met aanbevolen actie per account.
04Inbox triage. Leest nieuwe e-mails in een gedeelde inbox, classificeert, drafts een antwoord, laat de verzendknop aan de mens.

Vermijd de valkuil om in week één met een klantgerichte agent te beginnen. De eerste agent maakt het werk van een collega makkelijker, niet de ervaring van een klant risicovoller.

De twee-weken-build

Elke Notion agent die we shippen volgt grofweg hetzelfde traject.

01Week één, dag 1 en 2. Map de workflow zoals hij vandaag draait. Wie doet wat, in welk tool, met welke inputs en outputs. Schrijf het op als een lijst stappen. Dat is de spec.
02Week één, dag 3 en 4. Schoon de datalaag op. De databases waar de agent uit leest hebben consistente properties, een helder schema en een paar voorbeeldrecords nodig. De meeste agent-failures zijn data-failures.
03Week één, dag 5. Bouw de agent. Kies een trigger, schrijf de instructies, wire de connecties. Houd de eerste versie smal. Eén taak, één output.
04Week twee, dag 1 tot 3. Run in shadow mode. De agent draait, schrijft het resultaat naar een draft-property of een aparte database, de mens reviewt. Track accuraatheid op 50 tot 100 cases.
05Week twee, dag 4 en 5. Promote naar productie. Verplaats de output naar de live database. Houd de human review nog één sprint aan. Volg de metrics.

Twee weken tot een productie-agent is realistisch als de datalaag schoon is. Is de data een puinhoop, dan is de agent-build twee dagen en het datawerk twee maanden. Wees eerlijk over in welke je zit.

De drie failure modes om tegen te ontwerpen

Hallucinatie. De agent schrijft met overtuiging een fout veld. Mitigeer met citation-required outputs, een confidence score property en een human review op alles onder een drempel.

Drift. Het schema verandert, de agent breekt geruisloos. Mitigeer met een contract-laag tussen de agent en de database, en een eval die wekelijks draait op een vaste set records om regressies te vangen.

Kosten. De agent draait op elke paginawijziging en de rekening vervijfvoudigt in een maand. Mitigeer met een goedkoper model op de eerste pass, een duur model alleen op onzekere cases, en een hard plafond op runs per dag.

Evals, geen gevoel

Elke productie-agent heeft een eval-set. Een lijst van 50 tot 100 input-records met een bekende correcte output. Run de eval op elke betekenisvolle wijziging in de instructies, het model of de gekoppelde tools. Track accuraatheid als een getal. Zonder dit raad je.

De eval-set is ook het artefact dat je doorgeeft aan de volgende engineer. Het is het contract voor wat de agent geacht wordt te doen.

Wat er verandert voor het team

Wanneer een Notion agent live gaat verschuift het werk van het team: van de taak doen naar de output van de agent reviewen. Dat is een echte verandering. De eerste maand is ongemakkelijk. In maand twee is het team sneller dan voor de agent bestond, en hebben ze een lijst van drie agents die ze als volgende willen.

“De agents die blijven plakken zijn de agents die het team zelf vroeg na de eerste te hebben zien werken. Top-down agent-uitrol faalt. Pull vanuit het team werkt.”
- Elko Lemiso, Dissel AI

Als je hulp wilt

We draaien een twee-weken Notion agent sprint met founders die de eerste drie agents in productie willen zonder een consulting-traject van zes maanden. De structuur, de criteria en wat we afdekken staan op de Notion AI operating system pagina. Als je datalaag schoon is, staat de eerste agent in week twee live. Is dat niet zo, dan vertellen we je dat op de audit-call.

AI agents bouwen op Notion. Van idee naar productie in twee weken.