Is dit hetzelfde als ML / fine-tuning?

Nee. ML/fine-tuning past het model aan op jouw data, duur, ingewikkeld, en risicovol. Self-learning loops zoals ik ze beschrijf passen het *systeem rond het model* aan: rules, prompts, suggesties. Het model zelf blijft hetzelfde. Veel goedkoper, even effectief voor de meeste use cases.

Werkt dit in een team-setting?

Met aanpassingen ja. Patronen die door één persoon zijn geleerd, gelden niet automatisch voor het hele team. Voor team-loops: zorg dat suggesties expliciet zijn ("dit komt uit het patroon van Vincent's edits"), en dat acceptatie is per persoon, niet per team.

Hoeveel data heb je nodig voordat patronen ontstaan?

In mijn ervaring: 30-50 acties van hetzelfde type voordat eerste patronen zinvol detecteerbaar zijn. Voor een dagelijks-gebruikte workflow is dat 1-2 weken. Voor minder frequente workflows: maanden.

Werkt dit met Cursor of Codex CLI?

Het concept werkt overal. De implementatie is anders, Cursor heeft eigen feedback-mechanismen via Cursor Pro, Codex via `AGENTS.md`. Het patroon "track wat een mens kiest, vertaal naar suggesties" is universeel.

Wat is het verschil met een gewone TODO-lijst?

Een TODO-lijst registreert wat jij wilt doen. Een self-learning loop registreert wat het systeem heeft *gezien* dat jij doet, en daar suggesties op baseert. TODO is forward-looking input; self-learning is backward-looking pattern recognition.

Self-learning loops in AI: suggesties die je opvolgt |…

Een AI die suggesties doet die je consistent negeert, is alleen maar ruis in je inbox. Een AI die patronen herkent en suggesties doet die je vaker wel dan niet aanneemt, dat is een leerloop.

Het verschil is groot. En de meeste AI-systemen bevinden zich in de eerste categorie. Niet omdat ze technisch slecht zijn, maar omdat de feedback-mechanismen ontbreken. Het systeem leert nooit welke suggesties jij waardeert en welke je weggooit.

Vandaag voor AI peers en hobbyisten: hoe bouw je een self-learning loop die werkt? Geen autonomous AI die zelf beslist, wel een AI-systeem dat steeds beter wordt in het soort suggesties dat jij echt wil ontvangen. Concreet, met patronen uit mijn eigen VNX-systeem.

Het verschil tussen automatisch en autonoom

Eerst de framing. Self-learning loops worden vaak verward met autonome AI ("het systeem leert en doet alles zelf"). Dat is niet waar ik het over heb.

Wat ik bedoel met self-learning loop:

Het systeem detecteert patronen in jouw werk en stelt acties voor
Een mens beslist altijd of de actie wordt uitgevoerd
Het systeem leert van wat jij accepteert of afwijst
Volgende suggesties zijn beter afgestemd op wat jij waardeert

Wat ik NIET bedoel:

Het systeem doet zelf acties zonder jouw goedkeuring (= autonomous)
Het systeem update zichzelf zonder review (= self-modifying)
Het systeem trekt eigen conclusies over de business (= unsupervised)

Dat zijn drie hele andere systemen, met heel andere risico's. Autonome AI bestaat niet in een MKB-context op een betrouwbare manier. Self-learning loops met menselijke checks bestaan wel, en zijn productief.

Self-learning loop architectuur, patroonherkenning + suggestie + mens-beslist + feedback — AI detecteert patroon → suggestie → mens accepteert of wijst af → feedback verbetert volgend patroon. Vier stappen, zonder autonomy.

De vier componenten

Iedere werkende self-learning loop heeft vier onderdelen.

Component 1, Patroon-extractie

Het systeem moet patronen kunnen extraheren uit jouw eerdere acties. Welke beslissingen heb je herhaald? Welke configuraties heb je consistent gekozen? Welke fouten heb je twee keer gemaakt?

In mijn praktijk komen patronen uit:

Receipts van AI-dispatches, welke instructies leidden tot succes vs falen?
Edit-historie in mijn projecten, welke patronen herstel ik herhaaldelijk?
Memory updates, welke regels heb ik na correcties toegevoegd aan rules.md?

Deze drie bronnen samen geven een gestructureerde dataset. Geen vector-database nodig, geen RAG. Gewoon NDJSON of markdown, gestructureerd met audit-kolommen.

Component 2, Suggestie-generatie

Patroon herkend? Vertaal het naar een concrete suggestie aan jou. Belangrijk: geen vage adviezen. Concrete acties.

Slechte suggestie:

"Je doet dit vaak verkeerd, misschien moet je hier op letten."

Goede suggestie:

"Patroon: in 4 van de laatste 5 PRs heb je console.log toegevoegd voor debug, en daarna handmatig verwijderd voor commit. Voorstel: voeg console.log toe aan rules.md als verboden in committed code, met uitzondering voor tests/scripts. [Accept] [Wijzig] [Negeer]"

Drie verschillen: concreet patroon (4 van 5 PRs), concrete actie (rules.md update), concrete keuze (drie buttons).

Component 3, Mens beslist

Hier is waar de meeste AI-systemen falen, ze suggereren te veel, of ze geven geen makkelijke manier om te accepteren of af te wijzen.

In mijn Mission Control: een suggestie komt als Telegram-bericht met drie buttons. Eén tap = beslissing genomen. Geen lange dialoog, geen bevestigingen, geen "weet je het zeker?".

Cruciaal: de beslissing wordt vastgelegd. Niet alleen accepteren/afwijzen, ook context. Als ik 'wijzig' kies, vraagt de bot kort waarom. Dat antwoord gaat terug in de loop.

Component 4, Feedback in het systeem

De afsluitende stap. Wat doet het systeem met jouw beslissing?

Bij accept:

Patroon wordt versterkt, vaker triggeren bij vergelijkbare situaties
Eventueel direct toegepast (bijv. rules.md update)

Bij wijzig + reden:

Patroon wordt aangepast op basis van jouw feedback
Volgende keer wordt suggestie iets anders geformuleerd

Bij negeer:

Patroon wordt verzwakt, minder snel suggereren
Na 3x negeren: stop met dit type suggestie

Geen complexe ML. Gewoon een teller in een database, met regels voor wanneer iets wel of niet gesuggereerd wordt.

Concreet voorbeeld uit mijn praktijk

Een self-learning loop die ik voor mezelf bouwde, voor mijn blog-pipeline:

Periode 1 (eerste maand), bot leert mijn editing-patronen. Welke woorden vervang ik vaak? Welke alinea-structuren hertyp ik? Welke H2-titels keur ik af?

Periode 2 (tweede maand), bot stelt voor: "Ik zie dat je in 6 van de laatste 8 blogs de term 'leveraging' hebt vervangen door 'gebruiken'. Voorstel: voeg 'leveraging' toe aan vermijden-lijst in tone-of-voice.md. [Accept] [Wijzig] [Negeer]"

Ik klik Accept. Bot updates tone-of-voice.md. Volgende blogs: term niet meer gegenereerd.

Periode 3 (derde maand), bot stelt voor: "Patroon in laatste 4 blogs: je hebt iedere keer een H2 'Conclusie' veranderd in 'Samenvatting'. Voorstel: vervang in blog-writer skill. [Accept] [Wijzig] [Negeer]"

Ik klik Accept. Skill update.

Resultaat na 3 maanden: mijn blog-pipeline produceert iets dat steeds dichter bij wat ik zelf zou schrijven zit. Niet omdat AI mijn stem heeft geleerd. Wel omdat het systeem heeft geleerd welke aanpassingen ik consistent maak, en die preventief in de output stopt.

📖 Lees ook: Mijn AI-manager werd slechter naarmate ik langer met hem praatte: waarom patroon-extractie context-drift voorkomt

De drie valkuilen die ik ben tegengekomen

Eerlijk over de fouten.

Valkuil 1, Te veel suggesties

In mijn eerste versie kreeg ik 10-15 suggesties per dag. Verdronk in ze. Negeerde uit zelfbescherming.

Fix: threshold-systeem. Een suggestie wordt pas getriggerd na een patroon van 3+ herhalingen. En max 2-3 suggesties per dag, gerangschikt op confidence. Resultaat: ik kijk naar elk voorstel echt.

Valkuil 2, Suggesties die jezelf bewijzen

Slechte timing van suggesties: ze komen wanneer ik het niet kan beoordelen. Bijvoorbeeld een rules.md-suggestie tijdens een focus-sessie.

Fix: deferred suggestions. Suggesties komen niet realtime, maar in een dagelijkse samenvatting (bij mijn /status command). Ik kies een rustig moment om ze door te lopen.

Valkuil 3, Niet bijhouden waarom je negeert

Als ik een suggestie negeerde zonder reden, leerde de bot er niets van, de teller ging gewoon omhoog. Drie keer negeren = patroon verzwakt, maar het waarom miste.

Fix: light-weight reden. Bij negeren toont de bot drie korte redenen ("niet relevant", "te triviaal", "verkeerde context") plus "anders". Eén tap, twee seconden, drastisch betere learning-loop.

Wat dit niet kan

Eerlijk over grenzen. Self-learning loops in deze vorm:

Kunnen geen creatieve patronen extraheren. Als jij voor elke nieuwe blog een unieke hook bedenkt, ziet het systeem geen herhaalbaar patroon.
Kunnen geen domeinkennis vervangen. Het systeem leert jouw patronen, niet wat universeel goede aanpak is.
Kunnen geen architectuur-niveau beslissingen suggereren. Patroon-extractie werkt op micro-niveau (regels, woordkeuzes, kleine acties), niet op macro-niveau (welke architectuur kies ik).

Voor die soorten beslissingen blijft mens-mens-overleg of zelf nadenken het werkbaarste mechanisme.

Wat doe je deze week?

Drie acties:

Identificeer één micro-patroon dat je vaak herhaalt, bijvoorbeeld een woord-vervanging, een opmaak-correctie, of een terugkerende rules.md-update na correcties.
Bouw een minimale loop rond dat patroon. Hoeft geen Telegram-bot te zijn, een markdown-bestand waar je elke week 5 minuten in noteert wat je hebt aangepast, werkt ook.
Reviewen wekelijks of jouw rules/CLAUDE.md/skills een update krijgen op basis van wat je in stap 2 hebt verzameld.

Dat is een handmatige self-learning loop. Geautomatiseerd is het mooier; handmatig is het al waardevol. Begin handmatig, automatiseer later.

Veelgestelde vragen

Samenvatting

Een self-learning loop is geen autonomous AI. Het is een mens-beslist-systeem dat patronen extraheert uit jouw werk en suggesties doet die jij accepteert, wijzigt, of negeert. De feedback gaat terug in het systeem voor de volgende ronde.

Vier componenten: patroon-extractie, suggestie-generatie, mens-beslist, feedback. Drie valkuilen: te veel suggesties, slechte timing, geen reden bij negeren.

Begin met één micro-patroon, handmatig. Automatiseer als de loop bewezen waarde toevoegt. In 12 maanden heb je een AI-systeem dat steeds beter is in suggesties die jij echt wil ontvangen, zonder ooit autonomie weg te geven.

Vragen over zelfbouwen of automatiseren van een loop voor jouw workflow? Volg me op LinkedIn of neem contact op. Ik werk vaak aan vergelijkbare patronen met klanten.

Lees ook

📖 Lees ook: Agentic OS: waarom AI de centrale bediening voor je bedrijf wordt: hoe self-learning loops passen in een bredere agentic architectuur

📖 Lees ook: Prompt engineering is dood, lang leve context engineering: de basis voor betere suggestie-generatie

📖 Lees ook: Waarom 'autonome' AI agents niet bestaan: het onderscheid dat self-learning loops scherp houdt

📖 Lees ook: Human-on-the-Loop: van monitoring naar productie-autonomie: hoe je geleidelijk meer vertrouwen geeft aan je systeem

Vincent van Deth

AI Strategy & Architecture

Vincent van Deth bouwt productiesystemen met AI voor het MKB. Hij is de maker van VNX, een multi-agent LLM orchestrator, en helpt teams betrouwbare AI-automatisering te shippen — zonder bullshit.

LinkedIn Email GitHub

Self-learning loops: hoe je AI-systeem suggesties doet die je daadwerkelijk wil opvolgen