DALL-E 3는 AI 이미지 생성을 다음 수준으로 끌어올릴 수 있습니다 | ENBLE

DALL-E 3는 AI 이미지 생성을 끌어올릴 수 있습니다 | ENBLE

OpenAI

OpenAI는 현재 Decoder에 따르면 공개에 유출된 일련의 알파 테스트를 통해 DALL-E AI 텍스트에서 이미지를 생성하는 다음 버전을 준비 중일 수도 있습니다.

디스코드의 익명의 유출자가 DALL-E 3으로 알려진 예정 중인 OpenAI 이미지 모델에 대한 접근을 가지고 있었던 경험에 대한 세부 정보를 공유했습니다. 그는 5월에 처음으로 나타나 관심 기반 디스코드 채널에 OpenAI의 알파 테스트에 참여하고 새로운 AI 이미지 모델을 시도 중임을 알렸습니다. 그는 그때 생성한 이미지를 공유했습니다.

5월의 알파 테스트 버전은 이미지 모델 내부에서 다양한 가로세로 비율의 이미지를 생성할 수 있는 능력을 갖고 있었습니다. 유튜버 MattVidPro AI는 16:9 가로세로 비율에서 생성된 이미지 몇 장을 선보였습니다. 이 버전은 또한 모델이 고품질의 텍스트 생성에 능숙함을 보여주었으며, Stable Diffusion 및 Midjourney와 같은 최고 생성기에 대해서도 여전히 고민거리가 되고 있던 텍스트 생성에 대한 우월성을 보여주었습니다.

일부 예시는 벽돌 벽에 융합된 텍스트, 단어로 이루어진 네온 사인, 도시의 광고 사인, 케이크 장식, 산에 새겨진 이름과 같은 이미지를 선보였습니다. 모델은 DALL-E가 사람들을 생성하는 데 능숙하다고 주장합니다. 이 중 하나의 이미지는 파티에서 피시아이 포인트에서 스파게티를 먹고 있는 여성을 보여줍니다.

유출자는 7월 중순에 디스코드 채널로 돌아와 더 많은 세부 정보와 새로운 이미지를 공유했습니다. 그는 약 400명의 주제가 포함된 “폐쇄 알파” 테스트 버전의 일부라고 주장했습니다. 그는 이메일로 시험에 초대되었고 원래의 DALL-E 및 DALL-E 2도 테스트에 참여했다고 덧붙였습니다. 이로써 알파 테스트가 DALL-E 3를 위한 것일 수도 있음을 결론지었지만, 아직 확인되지는 않았습니다.

5월부터 7월까지 모델은 상당히 업데이트되었습니다. 유출자는 동일한 프롬프트를 기반으로 생성된 이미지를 공유함으로써 DALL-E 3이 시간이 지남에 따라 얼마나 강력해졌는지 보여주었습니다. 프롬프트는 핑크색 얼간이가 사이클 경기 중에 판다에게 하이파이브를 하는 모습을 그린 그림입니다. 자전거는 치즈로 만들어져 있고 땅은 매우 진흙으로 덮여 있습니다. 그들은 안개 낀 숲 속에서 운전하고 있으며, 판다는 화가 나있습니다.

5월의 알파 버전은 프롬프트의 대부분을 포함하는 일반적인 장면을 생성합니다. 손 사이에 약간의 왜곡이 있고, 자전거 바퀴는 치즈 대신 노란색입니다. 그러나 7월의 알파 버전은 핑크색 얼간이와 판다가 명확하게 하이파이브를 하고 자전거 바퀴는 여러 세대에서 모두 치즈로 만들어진 더 자세한 이미지를 생성합니다.

한편 Midjourney에서는 얼간이가 장면에서 사라지고 판다들은 자전거 대신 오토바이를 타고 있습니다. 진흙 대신 도로도 있습니다. 판다들은 화가 나는 대신 기쁩니다.

DALL-E 3 7월 알파 이미지 예시에는 이 모델의 잠재력을 보여주는 다양한 이미지들이 있습니다. 그러나 알파 테스트가 검열되지 않았으므로 유출자는 “폭력과 노출물 또는 회사 로고와 같은 저작권 자료”의 장면을 생성할 수도 있다고 언급했습니다.

일부 예시로는 혈투 애니메이션 소녀, 왕좌의 게임 캐릭터, Grand Theft Auto V 표지, 좀비 예수님이 Subway 샌드위치를 먹는 모습(약간의 잔혈이 있을 것으로 시사), 그리고 고고학적 발굴에서 Shrek이 발견되는 모습 등이 있습니다.

MattVidPro AI는 이미지 모델이 특정한 스타일에 있어야 하는 것처럼 이미지를 생성한다고 언급했습니다.

DALL-E 2는 2022년 4월에 출시되었으며 인기와 윤리 및 안전에 대한 우려 때문에 대기 목록으로 엄격히 규제되었습니다. 이 AI 이미지 생성기는 2022년 9월에 일반인에게 접근 가능해졌습니다.