이처럼 기존의 '언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM이 화두로 떠오르고 있다. 벤처비트는 11일(현지시간) 오픈 소스 커뮤니티에서 라바 1.5가 GPT-4V의 대안으로 떠오르며 인기를 얻고 있다고 소개했다.
출처 : AI타임스(https://www.aitimes.com)
미드저니 V6 - 사실성 굉장함, 미드저니로 만든 심슨, 귀멸의 칼날 등
Magnific.ai - 생성 이미지, 스테이크 사진 확대하면 디테일이 더 살아남
MS 코파일럿, 생성AI 음악기 '수노 suno.ai' 탑재 - 이제는 AI 음악 전쟁, 조코딩 노래 만들어 달라면 만들어줌
VideoPoet (LLM - )- 피카 랩스보다는 좀 떨어져 보임, 텍스트를 영상으로 만들어 줌
애플 LMM 페렛 (Ferret) - apple / ml-ferret, LLaMA, Vicuna, GPT-4
출처: https://www.youtube.com/watch?v=lycXwk_twLI 참조
오픈AI는 지난달 25일 공식 블로그를 통해 'GPT-4V(ision) 시스템 카드'라는 논문을 소개했다. LLM에 이미지 입력을 통합한 기술적인 문제와 이를 통해 확보한 안전성 등에 초점을 맞춘 내용이다. 즉 LMM를 주도하는 게 오픈AI라는 것을 강조하는 내용이다.
출처 : AI타임스(https://www.aitimes.com)
참고 문서
LLM은 옛말...이미지까지 학습한 'LMM' 뜬다 < 산업일반 < 산업 < 기사본문 - AI타임스 (aitimes.com)
https://cafe.naver.com/valuearchive/9822
https://cafe.naver.com/valuearchive/8120