'언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM

이처럼 기존의 '언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM이 화두로 떠오르고 있다. 벤처비트는 11일(현지시간) 오픈 소스 커뮤니티에서 라바 1.5가 GPT-4V의 대안으로 떠오르며 인기를 얻고 있다고 소개했다.

출처 : AI타임스(https://www.aitimes.com)

미드저니 V6 - 사실성 굉장함, 미드저니로 만든 심슨, 귀멸의 칼날 등

Magnific.ai - 생성 이미지, 스테이크 사진 확대하면 디테일이 더 살아남

MS 코파일럿, 생성AI 음악기 '수노 suno.ai' 탑재 - 이제는 AI 음악 전쟁, 조코딩 노래 만들어 달라면 만들어줌

VideoPoet (LLM - )- 피카 랩스보다는 좀 떨어져 보임, 텍스트를 영상으로 만들어 줌

애플 LMM 페렛 (Ferret) - apple / ml-ferret, LLaMA, Vicuna, GPT-4

출처: https://www.youtube.com/watch?v=lycXwk_twLI 참조

오픈AI는 지난달 25일 공식 블로그를 통해 'GPT-4V(ision) 시스템 카드'라는 논문을 소개했다. LLM에 이미지 입력을 통합한 기술적인 문제와 이를 통해 확보한 안전성 등에 초점을 맞춘 내용이다. 즉 LMM를 주도하는 게 오픈AI라는 것을 강조하는 내용이다.

출처 : AI타임스(https://www.aitimes.com)

참고 문서

LLM은 옛말...이미지까지 학습한 'LMM' 뜬다 < 산업일반 < 산업 < 기사본문 - AI타임스 (aitimes.com)

LLM은 옛말...이미지까지 학습한 'LMM' 뜬다 - AI타임스

\'대형언어모델(LLM)\'에 이어 앞으로는 \'대형멀티모달모델(LMM)\'이라는 용어가 보편화될 것으로 보인다. 기존에는 \'멀티모달 LLM\'으로 불렀으나, 최근 미국의 일부 기업과 매체가 기존 모델과의

www.aitimes.com

https://cafe.naver.com/valuearchive/9822

[동영상] 안될과학 - 프롬프트 엔지니어링

가끔 즐겨보는 방송인 Youtube "안될과학"에서 AI시대를 맞이하여 LMM을 설명하기 위해서 삼성SDS와 함께 방송이 있었습니다. 2편으로 구성되어 설명하고 있는데요. ...

cafe.naver.com

https://cafe.naver.com/valuearchive/8120

(7일차) AI 뉴스 - 미드저니 V6, 수노 작곡 AI, 구글 VideoPoet, 애플 LMM 오픈소스 공개 미래예측 AI 등 (

https://www.youtube.com/watch?v=lycXwk_twLI 정말 발전 속도가 상상을 초월하네요. 지금 어설프게 보이는 것들도 곧 인간이 한 것보다 뛰어나...

cafe.naver.com

어쩌다 보니 프로그래머인

'언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM

참고 문서

티스토리툴바