본문 바로가기
코딩공부-AI/LMM - Large Multimodal Models

'언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM

by 어다프 2024. 1. 2.

 

이처럼 기존의 '언어' 학습을 뛰어넘어 '이미지' 학습까지 더한 LMM이 화두로 떠오르고 있다. 벤처비트는 11일(현지시간) 오픈 소스 커뮤니티에서 라바 1.5가 GPT-4V의 대안으로 떠오르며 인기를 얻고 있다고 소개했다.

출처 : AI타임스(https://www.aitimes.com)

 

 

 

미드저니 V6 - 사실성 굉장함, 미드저니로 만든 심슨, 귀멸의 칼날 등

Magnific.ai - 생성 이미지, 스테이크 사진 확대하면 디테일이 더 살아남

MS 코파일럿, 생성AI 음악기 '수노 suno.ai' 탑재 - 이제는 AI 음악 전쟁, 조코딩 노래 만들어 달라면 만들어줌

VideoPoet (LLM - )- 피카 랩스보다는 좀 떨어져 보임, 텍스트를 영상으로 만들어 줌

애플 LMM 페렛 (Ferret) - apple / ml-ferret, LLaMA, Vicuna, GPT-4

출처: https://www.youtube.com/watch?v=lycXwk_twLI 참조

 

 

오픈AI는 지난달 25일 공식 블로그를 통해 'GPT-4V(ision) 시스템 카드'라는 논문을 소개했다. LLM에 이미지 입력을 통합한 기술적인 문제와 이를 통해 확보한 안전성 등에 초점을 맞춘 내용이다. 즉 LMM를 주도하는 게 오픈AI라는 것을 강조하는 내용이다.

출처 : AI타임스(https://www.aitimes.com)

 

참고 문서

LLM은 옛말...이미지까지 학습한 'LMM' 뜬다 < 산업일반 < 산업 < 기사본문 - AI타임스 (aitimes.com)

 

LLM은 옛말...이미지까지 학습한 'LMM' 뜬다 - AI타임스

\'대형언어모델(LLM)\'에 이어 앞으로는 \'대형멀티모달모델(LMM)\'이라는 용어가 보편화될 것으로 보인다. 기존에는 \'멀티모달 LLM\'으로 불렀으나, 최근 미국의 일부 기업과 매체가 기존 모델과의

www.aitimes.com

https://cafe.naver.com/valuearchive/9822

 

[동영상] 안될과학 - 프롬프트 엔지니어링

가끔 즐겨보는 방송인 Youtube "안될과학"에서 AI시대를 맞이하여 LMM을 설명하기 위해서 삼성SDS와 함께 방송이 있었습니다. 2편으로 구성되어 설명하고 있는데요. ...

cafe.naver.com

https://cafe.naver.com/valuearchive/8120

 

(7일차) AI 뉴스 - 미드저니 V6, 수노 작곡 AI, 구글 VideoPoet, 애플 LMM 오픈소스 공개 미래예측 AI 등 (

https://www.youtube.com/watch?v=lycXwk_twLI 정말 발전 속도가 상상을 초월하네요. 지금 어설프게 보이는 것들도 곧 인간이 한 것보다 뛰어나...

cafe.naver.com