Apple eksperymentuje z edycją obrazów przy użyciu sztucznej inteligencji

애플은 캘리포니아대학 산타바바라와의 협력으로 “MGIE(MLLM-Guided Image Editing)”라고도 알려진 오픈소스 인공지능(AI) 모델을 공개했습니다. 이 모델은 간단한 텍스트 명령을 사용하여 포토샵과 유사한 이미지 편집을 가능케 합니다.

애플은 AI 개발에서 비교적 유별나게 내성적이었습니다. 작년 ChatGPT에 대한 헤이즈는 있었지만, 이 기술과 관련된 주요 계획은 발표하지 않았습니다. 그러나 소식통에 따르면, 애플은 ChatGPT에서 영감을 받아 “애플 GPT”라는 자체 챗봇을 보유하고 있습니다. 또한 팀 쿡이 곧 AI와 관련한 중요한 이벤트를 선보일 것이라고 발표했습니다.

이 중 이벤트 중 하나가 AI를 활용한 이미지 편집 도구에 관련된 것인지는 아직 알려지지 않았습니다. 그러나 공개된 MGIE 모델은 분명히 애플이 이 분야에서 연구와 개발을 수행하고 있다는 것을 보여줍니다. 현재 사용 가능한 AI 도구들은 짧은 명령을 해석하는 데 어려움을 겪어 결과물이 만족스럽지 못한 경우가 많습니다. MGIE는 멀티모달 언어 모델(MLLM)을 활용하여 텍스트 명령과 훈련 이미지 데이터를 이해합니다. 그 결과, MGIE는 과도한 설명을 무시하고 자연스럽게 명령을 인식할 수 있습니다.

제시된 연구 예시들은 MGIE가 입력 이미지를 기반으로 독립적으로 명령을 추론할 수 있다는 것을 보여줍니다. 예를 들어, 페퍼로니 피자의 이미지와 “더 건강하게 만들어라”라는 명령이 주어진 경우, MGIE는 “it”이 페퍼로니 피자를 가리키고 “건강하게”는 채소를 추가하는 것을 추론할 수 있습니다. 결과적으로, 굵은 채소가 올려진 페퍼로니 피자의 이미지가 생성됩니다.

또 다른 비교적인 예시에서는 이미지가 숲 가장자리와 차분한 물을 나타내는데, 다른 모델들은 “번개를 추가하고 물에 번개가 반사되게 하라”는 지시에 따른 효과를 내지 못합니다. 그러나 MGIE는 이 효과를 성공적으로 재현합니다.

MGIE 모델은 GitHub 플랫폼에서 오픈소스 모델로, Hugging Face 플랫폼에서 데모 버전으로 사용할 수 있습니다. 이를 통해 누구나 AI를 활용한 이미지 편집에 실험을 시작할 수 있습니다.

애플은 앞으로도 AI 분야에서의 연구와 개발을 이어가며, 혁신적인 도구와 응용프로그램을 제공할 것으로 기대됩니다.

자주 묻는 질문(FAQ)