Apple werkt aan het integreren van Google’s Gemini AI in de iPhone. Daarmee wil het bedrijf Siri slimmer maken voor langverwachte AI-functies. Apple probeert de grote Gemini-modellen te verkleinen zodat ze lokaal op de telefoon draaien. Toch zal de vernieuwde Siri sterk leunen op cloud-infrastructuur van Google en Nvidia. Dat meldt technologiewebsite Ars Technica op basis van interne bronnen. De vertraging in Apples AI-plannen loopt al lange tijd.
Het verkleinen van AI-modellen heet “distillation”. Daarbij leert een kleiner model de uitkomsten van een veel groter model na te bootsen. Dit maakt het mogelijk om nuttige functies te bewaren, terwijl het model minder geheugen en energie verbruikt. Eenvoudige Siri-taken kan de iPhone zo lokaal verwerken, zonder internetverbinding. Maar voor complexe verzoeken stuurt het systeem de data naar externe servers. Apple bleek moeite te hebben met de grote, onverkleinde Gemini-modellen op zijn eigen Private Cloud Compute-servers. Die servers draaien op Apples eigen M-serie chips.
Voor cloudverwerking sloot Apple een deal met Nvidia. Nvidia’s Confidential Computing-platform versleutelt data terwijl servers het in de cloud verwerken. Dit moet Apples privacybelofte ondersteunen. Toch lopen complexe Siri-verzoeken via Google’s cloud-infrastructuur. Dat staat op gespannen voet met Apples imago als privacybewust bedrijf. Apple benadrukt normaal juist zijn eigen chips en veilige verwerking als unieke voordelen.
Gebruikers zullen niet zien welke versie van Gemini hun verzoek afhandelt. Apple wil de ervaring naadloos laten aanvoelen, als een geheel. Het bedrijf behoudt mogelijk zelfs zijn eigen “Private Cloud Compute”-merknaam voor dit systeem. Apple zal de nieuwe Siri naar verwachting aankondigen tijdens WWDC. De keuze voor externe cloudpartners lijkt nu onvermijdelijk om de concurrentie bij te houden.