Apple Otwiera Kod Źródłowy Modelu Sztucznej Inteligencji do Edycji Zdjęć

Apple is momenteel niet een van de toonaangevende spelers op het gebied van kunstmatige intelligentie (AI), maar hun nieuwe open-source AI-model voor beeldbewerking laat zien waar dit bedrijf toe in staat is. Het model, genaamd MLLM-Guided Image Editing (MGIE), maakt gebruik van multimodale taalmodellen om op tekst gebaseerde opdrachten te interpreteren terwijl ze afbeeldingen manipuleren.

Hoewel dit niet de eerste tool is die hiertoe in staat is, zijn “menselijke instructies soms te beknopt voor de huidige methoden om te begrijpen en op te volgen,” zoals beschreven in een artikel over dit project. Apple heeft samengewerkt met onderzoekers van de Universiteit van Californië, Santa Barbara bij de ontwikkeling van MGIE. De taalmodellen hebben de kracht om eenvoudige of dubbelzinnige op tekst gebaseerde instructies om te zetten in gedetailleerdere en duidelijkere instructies die de fotobewerker kan begrijpen. Bijvoorbeeld, als een gebruiker een foto van een peperonipizza wil bewerken om het er “gezonder uit te laten zien,” kunnen de taalmodellen dit interpreteren als “groentetoppings toevoegen” en de afbeelding dienovereenkomstig bewerken.

MGIE kan niet alleen significante veranderingen aanbrengen in afbeeldingen, maar ook foto’s bijsnijden, vergroten en verkleinen, evenals helderheid, contrast en kleurbalans verbeteren, allemaal via op tekst gebaseerde opdrachten. Het kan ook specifieke delen van een foto bewerken, zoals het veranderen van iemands haar, ogen of kleding, of het verwijderen van elementen uit de achtergrond.

Volgens VentureBeat heeft Apple dit model beschikbaar gesteld via GitHub, maar geïnteresseerde personen kunnen ook een demonstratie uitproberen die momenteel toegankelijk is op het Hugging Face Spaces-platform. Apple heeft nog niet aangekondigd of ze van plan zijn om de kennis die ze hebben opgedaan met dit project op een manier te gebruiken die het mogelijk maakt om het als een tool of functie in hun producten op te nemen.

Veelgestelde vragen (FAQ) – MGIE: Apples Nieuwe Open-Source AI Model voor Beeldbewerking

1. Wat is MGIE?
MGIE staat voor MLLM-Guided Image Editing en is een open-source AI-model voor beeldbewerking ontwikkeld door Apple in samenwerking met onderzoekers van de Universiteit van Californië, Santa Barbara. Het maakt gebruik van taalmodellen om op tekst gebaseerde instructies om te zetten in gedetailleerde bewerkingen van afbeeldingen.

2. Wat kan MGIE doen?
MGIE kan afbeeldingen bewerken door tekstuele opdrachten te interpreteren. Het kan significante veranderingen aanbrengen, bijsnijden, vergroten, verkleinen, de helderheid verbeteren, het contrast aanpassen, de kleurbalans aanpassen en specifieke delen van een foto bewerken.

3. Hoe kan ik MGIE uitproberen?
MGIE is beschikbaar via GitHub en er is ook een demonstratie beschikbaar op het Hugging Face Spaces-platform waar gebruikers het kunnen uitproberen.

4. Zal Apple MGIE integreren in hun producten?
Apple heeft nog geen aankondiging gedaan over het integreren van MGIE in hun producten. Het is niet bekend of ze van plan zijn om de verkregen kennis uit dit project op die manier te benutten.

Bron: [voeg hier een hyperlink naar een relevante bron toe]

The source of the article is from the blog mivalle.net.ar