Bezig met een experiment rond een taal-algoritme. Eentje die zelf onderwerpen vindt in een verzameling documenten. Door te kijken naar de woorden en waar ze voorkomen maakt het zelfstandig een soort ‘topic map’. Waarbij de gerelateerde woorden ook bij elkaar komen.
Het trainen van dit model doe ik door mijn tweets er in te stoppen. Beetje lastige verzameling documenten, blijkt. Omdat ze kort zijn en over heel veel verschillende onderwerpen gaan werkt het niet goed om zo’n kaart te maken.
Tijdens het werk scrollt er een oude tweet uit 2007 door de terminal. “Zoon (4) wil me lief verzorgen bij het ontbijt. Papa jij een lekker biertje?”. Eerst raakt dit me wegens de tekst zelf. Wat lief was dat. Vervolgens raakt de nostalgie me. Dat was 10 jaar geleden. Die zoon is nu 14. De oudste is net 18 geworden, doet eindexamen en gaat over een paar maanden verhuizen naar Delft. Damn wat gaat het snel. Wat leuk om die oude tweet nog te hebben.
Maar ik herpak me en ik zie dat wat mijn zoontje daar deed ook een mooi voorbeeld is van hoe dat algoritme werkt. Biertje is lekker, dat zegt papa inderdaad vaak. Hoort bij eten en drinken. Maar hoort niet bij topic ‘ontbijt’. Zo leerde mijn zoontje dat op dat moment. En zo werkt het trainen van AI modellen ook.
Dus als een AI model je ooit een suggestie doet om een biertje te nemen bij het ontbijt, denk dan ook even ‘ah wat lief’. Voor je de bug gaat melden ;-).