Anthropic heeft Claude Opus 4.8 uitgebracht. Dit nieuwe taalmodel is de opvolger van Opus 4.7, dat vorige maand verscheen. De release volgt snel op de vorige versie. Opus 4.8 scoort op de meeste benchmarks iets beter dan zijn voorganger. Maar de eerlijkheid van het model is volgens Anthropic de meest opvallende verbetering.
Met ‘eerlijkheid’ bedoelt Anthropic een concreet verschil in gedrag. Het model geeft vaker toe dat het een antwoord niet weet. Bovendien doet het minder uitspraken die het niet kan onderbouwen met feiten. Eerdere AI-modellen gaven soms zelfverzekerd antwoorden, ook als die antwoorden onjuist waren. Opus 4.8 is terughoudender en geeft zijn beperkingen eerlijk toe. Dit klinkt eenvoudig, maar is technisch een grote uitdaging voor de makers van AI.
Dit is een directe reactie op een bekend probleem: hallucinaties. Taalmodellen verzinnen soms informatie die klinkt als een feit, maar dat niet is. Dit probleem komt voor bij alle grote taalmodellen. Het is gevaarlijk als mensen AI gebruiken voor medische, juridische of financiële vragen. Door vaker ‘ik weet het niet’ te zeggen, wordt Opus 4.8 betrouwbaarder. Gebruikers weten dan beter wanneer ze het antwoord van het model kunnen vertrouwen.
Anthropic richt zich al langer op veilig en betrouwbaar AI. Het bedrijf staat bekend om zijn onderzoek naar ‘AI safety’. De nadruk op eerlijkheid past perfect bij die missie. Met Opus 4.8 zet het bedrijf een nieuwe stap in het bouwen van transparante AI-modellen. Dat is een waardevolle ontwikkeling in een tijd waarin AI steeds meer invloed heeft op ons dagelijks leven en werk.