Apple Wprowadza Nowe Narzędzie AI do Edytowania Zdjęć

Apple w końcu dołącza do innych gigantów technologicznych, takich jak Google i Microsoft, w tworzeniu narzędzi AI. Naukowcy firmy opracowali nowy model, który umożliwia użytkownikom edycję obrazu poprzez wprowadzanie tekstu w języku naturalnym – tak samo jak komendy używane są do generowania zdjęć.

Zgodnie z opublikowanym artykułem, model MGIE firmy Apple pozwala na przycinanie, zmianę rozmiaru, obracanie i dodawanie filtrów do zdjęć za pomocą poleceń tekstowych. Firma współpracowała przy tym projekcie z Uniwersytetem Kalifornijskim w Santa Barbara.

Jak działa ten model? MGIE, co oznacza MLLM-Guided Image Editing, umożliwia przetworzenie zwykłego zdjęcia w bardziej dramatyczne za pomocą prostych poleceń. Według artykułu, „edycja obrazów oparta na instrukcjach poprawia kontrolowalność i elastyczność manipulacji obrazem za pomocą naturalnych poleceń, bez skomplikowanych opisów czy maskowania regionalnego”. Według badaczy, metoda Apple oparta na multimodalnym dużym modelu językowym (MLLM) wykazuje obiecujące możliwości w zakresie rozumienia wielomodalnego i generowania odpowiedzi związanych z percepcją wizualną.

Badacze podzielili się kilkoma przykładami. W jednym z nich, zwykłe zdjęcie mężczyzny, któremu kobieta zrobiła zdjęcie na drugim planie, może być łatwo przekształcone za pomocą tekstu „usunąć kobietę z tła”. Podobnie, zbyt ciemne zdjęcie może zostać rozjaśnione i dodać do niego więcej kontrastu za pomocą prostego komendy tekstowej, na przykład „dodać więcej kontrastu, aby uzyskać większe oświetlenie”.

Jak się to różni od modeli Google i Microsoft?
Obecnie modele lub narzędzia oferowane przez Google i Microsoft umożliwiają tylko generowanie zdjęć AI za pomocą poleceń tekstowych. Jeśli chodzi o edycję, Microsoft niedawno ogłosił Designer dla Copilot, który korzysta z technologii DALL-E 3. Narzędzie to umożliwia użytkownikom edytowanie obrazów wygenerowanych przez AI. Użytkownicy mogą wyróżnić obiekt, aby się wyróżniał, dodać rozmycie tła i zmienić styl sztuki. Funkcje edycji obrazu firmy Microsoft są dostępne w języku angielskim dla użytkowników w Indiach, Australii, Nowej Zelandii, USA i Wielkiej Brytanii.

FAQ:

1. Co firma Apple opracowała w dziedzinie sztucznej inteligencji?
Firma Apple opracowała nowy model, który umożliwia użytkownikom edycję obrazu poprzez wprowadzanie tekstu w języku naturalnym.

2. Jak nazywa się ten model?
Model nazywa się MLLM-Guided Image Editing (MGIE).

3. Jak działa model MGIE?
Model MGIE przetwarza zwykłe zdjęcie za pomocą prostych poleceń tekstowych. Umożliwia przycinanie, zmianę rozmiaru, obracanie i dodawanie filtrów do zdjęć.

4. Z kim firma Apple współpracowała przy tym projekcie?
Firma Apple współpracowała przy tym projekcie z Uniwersytetem Kalifornijskim w Santa Barbara.

5. Jakie są możliwości edycji obrazu przy użyciu modelu MGIE?
Model MGIE umożliwia różne manipulacje obrazem. Na przykład, można usunąć obiekty z tła, rozjaśnić zdjęcia, dodać więcej kontrastu itp.

6. W czym ta technologia różni się od modeli Google i Microsoft?
Obecnie modele lub narzędzia oferowane przez Google i Microsoft umożliwiają tylko generowanie zdjęć za pomocą poleceń tekstowych. Model MGIE firmy Apple pozwala również na edycję obrazów za pomocą tekstu.

Key Terms:

1. Sztuczna inteligencja (AI) – dziedzina informatyki zajmująca się tworzeniem maszyn, które wykazują zdolności intelektualne podobne do ludzkich.

2. Model – w kontekście sztucznej inteligencji oznacza algorytm, który pozwala maszynom na przetwarzanie danych i wykonywanie określonych zadań.

3. Edycja obrazu – proces modyfikowania, poprawiania i usprawniania obrazów za pomocą różnych narzędzi i technik.

Suggested Related Links:

Oficjalna strona Apple
Google
Microsoft

The source of the article is from the blog elektrischnederland.nl