(AI 뉴스) 23.03.29 이미지 생성 AI 모델 “Kalo”의 진화! “한 장의 사진으로 다채로운 아바타를 그려보세요”

카카오브레인팀의 이미지 생성 AI 모델 ‘칼로’의 새로운 AI 프로파일 서비스가 출시됐다는 소식이다.

하나의 사진은 다양한 스타일의 아바타를 최대 140개까지 제공하며, 제작된 AI 아바타는 무료로 다운로드 받아 공유할 수 있다.


텍스트 요약

카카오브레인은 자체 이미지를 기반으로 AI 모델 ‘칼로’를 생성하는 이미지 생성·공유 플랫폼 ‘비^디스커버(B^DISCOVER)’에 ‘AI 프로필’ 서비스를 28일 추가했다.

“AI 프로필”은 AI가 사용자가 지정한 이미지를 기반으로 다양한 프로필 이미지를 생성하는 서비스입니다. 사용 방법은 매우 간단합니다. “Be Discover” 애플리케이션에서 사용자의 연령과 성별을 선택하고 사용자의 사진 파일을 업로드한 후 “Generate” 버튼을 클릭합니다.

업로드된 이미지와 사용자 정보 기반 인공지능 판타지, 타임슬립, 데일리 등 다양한 컨셉의 아바타 100개를 약 1분 안에 업로드할 수 있다.사용

생성된 100개의 이미지 외에도 새로운 이미지를 보고 싶다면 추가 이미지를 생성할 수 있습니다. “추가 생성” 버튼을 누르면 2회마다 20개의 새로운 이미지만 확인할 수 있습니다.

이는 사용자가 하나의 이미지를 입력하여 총 140개의 AI 아바타를 생성할 수 있음을 의미합니다. 무엇보다 인공지능이 얼굴 이미지 생성은 물론 각 콘셉트에 맞는 배경을 칠해 완성도 높은 프로필 이미지를 만들어준다는 점이다.

사용자는 생성된 AI 프로필 이미지를 자유롭게 다운로드하여 공유할 수 있으며, SNS 프로필로도 사용할 수 있습니다. ‘비디스커버’의 ‘AI 프로필’ 서비스 건당 6,600원생성된 프로필 이미지는 결제 후 1년간 “비디스커버” 앱에 저장할 수 있습니다.

지난 10월 발매된 ‘Be Discover’ 3월 초 누적 이미지 생성량 1,100만 개 돌파했다. ‘비디스커버’는 이미지 제작을 위한 ‘좋아요’, 리마인더를 위한 ‘검색’, ‘탐색’ 기능을 통해 칼로가 만든 이미지를 더 많은 사용자가 공유하고 감상할 수 있도록 서비스로 진화했다. 특히 지난달 22일부터 3월 23일까지 지난 31일 동안 ‘비디스커버’ 이용자들의 앱 내 평균 체류시간은 27분 6초였다.

반면 카카오브레인은 소속 연구원들이 주도하는 연구논문이다.컴퓨터 비전 및 패턴 인식 분야 세계 최고의 인공지능 협회인 “CVPR 2023″에 “Generalizable Implicit Neural Representations with Instance Pattern Composers” 제출했다 전체 투고 논문 중 상위 2.5% 이내로 선정글로벌 규모로 카카오브레인의 AI 연구 역량을 입증하고 있다.

추가 조사

1. 칼로는 어때? 만들기 정말 잘하시죠?

이미지 변경

– 캐릭터를 포착하는 것 같지만 그림의 스타일이나 스타일은 아닙니다.

– 변화하는 가중치 값을 조정할 수 있으면 좋을 것 같습니다. 현재 빌드 결과는 조금도 변경되지 않은 것으로 보입니다.


Kahlo의 이미지 변형 데모 결과

2. Instance Pattern Composers 논문을 사용한 일반화 가능한 암시적 신경 표현을 확인하십시오!

최근 CVPR에서 인정받은 인기 논문이라 궁금합니다. 요약 부분을 번역해서 가져왔습니다!

Implicit Neural Representations(INR)의 최근 발전에도 불구하고 INR의 좌표 기반 MLP(Multilayer Perceptron)가 데이터 인스턴스 전반에 걸쳐 일반적인 표현을 학습하고 보이지 않는 인스턴스 성별로 일반화하는 것은 여전히 ​​어려운 일입니다. 이 작업에서는 좌표 기반 MLP가 복잡한 데이터 인스턴스를 나타낼 수 있도록 하는 일반화 가능한 INR을 위한 간단하면서도 효과적인 프레임워크를 소개합니다. 나머지 MLP 가중치는 인스턴스 간 공통 표현에 대한 패턴 구성 규칙을 학습합니다. 우리의 일반 INR 프레임워크는 보이지 않는 인스턴스를 예측하는 변조 가중치를 학습하기 위해 기존 메타 학습 및 하이퍼네트워크와 완벽하게 호환됩니다. 광범위한 실험을 통해 우리의 방법이 오디오, 이미지 및 3D 개체를 포함한 광범위한 도메인에서 고성능을 달성하는 반면 절제 연구는 가중치 변조를 검증합니다.

암시적 신경 표현(INR)의 최근 발전에도 불구하고 데이터 인스턴스 간의 공통 표현을 학습하고 보이지 않는 인스턴스로 일반화하는 것은 INR의 좌표 기반 다층 퍼셉트론(MLP)에 대한 도전 과제로 남아 있습니다. 이 작업에서 우리는 좌표 기반 MLP가 초기 MLP 계층에서 인스턴스 패턴 작성자를 사용하여 작은 가중치 세트만 변조함으로써 복잡한 데이터 인스턴스를 나타낼 수 있도록 하는 일반화 가능한 INR을 위한 간단하지만 효과적인 프레임워크를 소개합니다. 나머지 MLP 가중치는 인스턴스 전체에서 일반 표현에 대한 패턴 구성 규칙을 학습합니다. 우리의 일반 INR 프레임워크는 보이지 않는 인스턴스를 예측하는 변조 가중치를 학습하기 위해 기존 메타 학습 및 하이퍼네트워크와 완벽하게 호환됩니다. 광범위한 실험은 우리의 방법이 오디오, 이미지 및 3D 개체를 포함한 광범위한 도메인에서 고성능을 달성하는 반면 절제 연구는 가중치 변조를 검증함을 보여줍니다.

제 생각에는

– 제너레이티브 모델의 아버지 DALLE2의 데모 결과가 궁금해서 비교해 보았습니다.

– OPENAI의 DALLE2와 화질 및 제작 결과에서 차이가 있는 것 같습니다. 해상도의 차이가 컴퓨팅 리소스의 가장 큰 원인인 것 같습니다.

– 또한 DALLE2는 이미지를 이해하고 사물의 특성을 잘 파악하여 만들어내는 것 같습니다. (개구리 눈, 맥북의 애플 위치를 보면 알 수 있다.)

– 대신 칼로 개구리 눈에 사과가 나타납니다.


트랏 2 홈

DALLE2 이미지 변경 데모 결과

Dali 2 데모 체험이 여기 있습니다!

https://openai.com/product/dall-e-2

원천

https://www.aitimes.kr/news/articleView.html?idxno=27659

이미지 생성 AI 모델 “Kalo”의 진화! , “단일 사진에서 다채로운 아바타 그리기” – at

카카오브레인은 자체 이미지를 기반으로 AI 모델 ‘칼로’를 생성하는 이미지 생성·공유 플랫폼 ‘비^디스커버(B^DISCOVER)’에 ‘AI 프로필’ 서비스를 28일 추가했다. ‘AI 프로필’은 사용자

사랑의 시간 네트워크