[뉴스] 성능은 살리고 비용은 확 줄인, GPT-4 미니가 가져온 AI 혁신의 시작
성능은 살리고 비용은 확 줄인, GPT-4 미니가 가져온 AI 혁신의 시작
최근 오픈AI에서 비용을 크게 줄인 ‘GPT-4o 미니’ 모델을 공개했습니다. 이 모델은 기존 GPT-4 대비 훨씬 작고 저렴하면서도 빠른 응답 속도를 자랑하는데요, 성능도 놀랍게도 GPT-3.5 터보보다 훨씬 뛰어나고, 채팅 선호도에서는 GPT-4보다도 우수한 결과를 보이고 있습니다. 특히 1백만 토큰 기준 API 비용이 경쟁 모델 대비 절반 이하로 저렴해 가성비가 뛰어나고, 이미지 인식 기능까지 지원하는 멀티모달 모델이라는 점이 인상적입니다. 따라서 기존 GPT-3.5 사용자라면 비용 절감과 성능 향상을 위해 GPT-4o 미니로 교체하는 것을 적극 추천할 만합니다. AI 모델 선택 시 비용과 성능을 모두 고려하는 분들에게 꼭 참고할 만한 소식입니다.
[영상 정보]
- 영상 제목: AI 뉴스 - GPT-4o mini, 유튜브 자막데이터 무단 사용, 라마3 4050억 모델, 허깅페이스 초소형 모델, 구글MS 중국 지원 발각, TTT 아키텍쳐 등
- 채널명: 조코딩 JoCoding
- 업로드 날짜: 2024-07-22
- 영상 길이: 13:09
[영상에서 사용한 서비스]
- - 조코딩 : https://jocoding.net/ — 코딩 공부 및 교육 플랫폼
- - 조카소 : https://jocasso.codemafia.io — 자막/번역/더빙 AI, 사진 AI 등 서비스
- - 오픈AI GPT-4o 미니 : https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/ — 최소형 AI 언어 모델
- - 오픈AI Sora 유튜브 채널 : https://www.youtube.com/@OpenAI/videos — Sora 관련 영상 공개
- - DALL·E : https://x.com/angrypenguinPNG/status/1812716411695026347 — 이미지 생성 AI, 글씨 개선 업데이트 관련
- - Streetscapes : https://twitter.com/_akhaliq/status/1814147143461933464 — 스트리트뷰 부드럽게 이어주는 AI 기술
- - Kolors IP-Adapter : https://twitter.com/multimodalart/status/1814230876823159200 — 이미지 변환용 AI 어댑터
- - 유튜브 자막 데이터 무단 사용 관련 기사 : https://www.aitimes.com/news/articleView.html?idxno=161778 — AI 학습용 데이터 무단 사용 문제
- - Proof News (AI 학습 관련) : https://www.proofnews.org/apple-nvidia-anthropic-used-thousands-of-swiped-youtube-videos-to-train-ai/ — AI 학습에 유튜브 영상 무단 사용 보도
- - 라마 3 (LLaMA 3) : https://www.aitimes.com/news/articleView.html?idxno=161590 — 대형 멀티모달
- - 오픈AI GPT-4o 미니 : https://openai.com — AI 언어 모델, 저비용 고성능 챗봇 및 API 제공
- - 제미나이 플래시 (Gemini Flash) : https://ai.google — 구글의 AI 모델, 자연어 처리 및 멀티모달 기능 제공
- - 클로드 (Claude) : https://anthropic.com — Anthropic에서 개발한 AI 언어 모델
- - 젠 3 (Gen-3) : https://runwayml.com — Runway ML의 영상 생성 AI 플랫폼
- - 루마 (Luma) : https://lumalabs.ai — 3D 및 영상 AI 생성 플랫폼
[주요 내용]
오픈AI가 비용과 속도를 크게 개선한 GPT 4o 미니 모델을 공개했습니다. 기존 대비 훨씬 작고 저렴하면서도, 성능은 82% 수준으로 뛰어나 채팅 선호도에서 GPT-4를 앞서는 점이 인상적입니다. 경제성과 효율성을 동시에 잡은 AI 모델에 관심 있는 분께 꼭 추천드려요.
GPT 4.5 미니는 GPT 3.5 터보보다 약 5점 이상 높은 성능을 보여주며, 이미지 인식까지 가능한 멀티모델로 진화했습니다. 가격도 더 저렴하고 속도도 빨라 3.5를 완전히 대체할 만한 효율적인 선택지로 자리잡고 있습니다.
1밀리언 토큰 기준으로 G4 미니는 플래시보다 훨씬 저렴하면서도 성능 점수가 높아 가성비가 뛰어납니다. 특히 128k 이상 작업에서는 비용 차이가 커서, 경제적인 AI 활용을 고민하는 분들께 좋은 선택지가 될 수 있습니다. 가격이 낮아지면 활용 범위가 넓어져 다양한 작업에 부담 없이 적용할 수 있다는 점이 인상적입니다.
토라 영상 7편이 공개되며 퀄리티가 눈에 띄게 좋아졌습니다. 특히 소라 영상은 옛날 영화 느낌을 잘 살려 실제 사람이 연기한 듯한 자연스러움과 부드러움이 돋보여, 어르신들도 감탄할 만한 완성도를 보여줍니다. AI 영상 발전과 감성 표현의 조화가 인상적입니다.
소라 AI가 부드럽게 잘 나온다는 평과 함께, 페이스북에 돌고 있는 가짜 소라 출시 광고는 악성코드가 포함된 위험한 스틸러 프로그램이니 절대 다운로드하지 말아야 한다는 점을 친절히 알려줍니다. 안전한 AI 활용을 위해 꼭 주의가 필요한 내용입니다.
AI 기술로 스트리트뷰가 한층 자연스럽게 진화했습니다. 기존처럼 사진 한 장씩 끊기던 방식 대신, AI가 이동 경로를 매끄럽게 합성해 실제 영상처럼 보여주는데요. 특히 비디오 디퓨전을 활용해 지도를 보며 걷는 듯한 경험을 제공해, 스트리트뷰 활용이 훨씬 더 흥미롭고 실감 나게 변했습니다. 다만 한글 글씨 표현은 아직 개선이 필요하다는 점도 함께 확인할 수 있었습니다.
게임 앱에 활용하기 좋은 IP 어댑터는 스타일을 그대로 반영해 새로운 이미지를 만들어내는 기술로, 실제 결과가 뛰어납니다. 특히 그림체를 살려 다양한 이미지 생성이 가능해 창작과 데이터 활용에 흥미로운 가능성을 보여줍니다.
유튜브 영상과 논문 등 온라인 콘텐츠가 무단으로 AI 학습용 데이터셋에 포함되어 저작권 분쟁이 발생했습니다. 특히 비영리 단체가 만든 대규모 데이터셋 ‘더 파일’이 여러 AI 기업에 공급되었고, 조 코딩 영상도 사용된 사실이 밝혀져 저작권 문제의 심각성을 보여줍니다. AI 학습과 저작권 충돌에 대해 객관적 근거와 사례로 이해할 수 있는 내용입니다.
메타에서 공개한 라마 3는 450억 매개변수를 가진 대형 AI 모델로, GPT-3보다 훨씬 크고 강력합니다. 이 모델이 오픈소스로 공개되면서 AI 연구와 오픈소스 생태계에 새로운 발전 가능성을 열어주고 있죠. 최신 점수 비교를 보면 GPT-4.5가 82점으로 꽤 높은 성능을 보여주지만, 라마 3도 계속 훈련 중이라 앞으로 더 나아질 여지가 큽니다. AI 모델 크기와 성능 변화에 관심 있는 분들께 꼭 참고할 만한 내용입니다.
최신 AI 모델들이 오픈 소스로 공개되면서 혁신이 가속화되고 있습니다. 특히 라마 차기 버전은 유럽의 엄격한 AI 규제 때문에 출시가 제한되지만, 영국 시장에는 예외적으로 출시된다는 점이 흥미롭습니다. 엔비디아와 미스트랄이 협력해 기업용 온디바이스 AI 모델을 선보인 것도 주목할 만한 변화입니다. AI 규제와 시장 대응 전략을 객관적으로 살펴볼 수 있는 내용입니다.
실무자용 온디바이스 AI ‘미스트랄 네모’는 12억 파라미터로 적당한 크기와 뛰어난 성능을 자랑합니다. 엔비디아 GPU 최적화로 빠른 코드 생성이 가능하며, 기존 코딩 AI와 비교해도 손색없는 결과를 보여줍니다. 작아진 모델 크기와 향상된 성능이 인상적이라 AI 개발 흐름을 이해하는 데 도움이 됩니다.
AI 에이전스용 초고속 칩과 오픈소스 모델이 빠르게 발전하며, 라마 3 기반 모델이 9.76% 정확도로 리더보드 1위를 차지했습니다. 허깅페이스에서 가볍게 실행 가능한 소형 언어모델도 출시되어 로컬 환경에서도 AI 활용이 한층 쉬워졌다는 점이 인상적입니다.
작고 가벼운 AI 모델임에도 GPT-2와 비교해 뛰어난 성능을 보여주며, 특히 한글-영어 번역에 특화된 라지 랭귀지 모델이 GPT-4와 구글, MS 모델을 능가하는 점이 인상적입니다. 최신 모델은 처리 속도도 25% 개선되어 실용성까지 갖췄다는 점에서 주목할 만합니다.
레이턴시가 25% 줄어 0.3초 내 빠른 응답이 가능해졌고, 한국어를 포함한 다양한 언어 지원으로 AI 대화 서비스나 게임 개발에 큰 도움이 됩니다. 터보 2.5 모델을 활용하면 더욱 신속한 API 응답을 경험할 수 있어 실용적입니다.
AI 디자인 도구가 이제 누구나 쉽게 사용할 수 있게 공개되어 카드 뉴스나 썸네일 제작이 훨씬 편리해졌습니다. 특히, 트랜스포머를 대체할 가능성이 있는 ‘테스트 타임 트레이닝’ 아키텍처 논문도 소개되어 AI 발전 방향을 객관적으로 이해하는 데 도움이 됩니다.
라지 랭귀지 모델의 정확성과 설명력을 높이기 위해 ‘증명자-검증자 게임 이론’을 활용하는 새로운 기술이 공개되었습니다. 더 똑똑한 모델이 문제 해결을 설명하고, 덜 똑똑한 모델이 이를 검증하는 방식으로 성능을 체계적으로 개선하는 방법입니다. AI 모델 신뢰도 향상에 관심 있는 분들께 꼭 추천합니다.
AI 교육 스타트업을 창업한 안드레 카파시가 생성 AI를 활용해 개별 맞춤형 학습을 지원하는 혁신적인 플랫폼을 선보입니다. 세계 최고 수준의 AI 과정 개발로 교육의 새로운 가능성을 열어가고 있어 기대가 큽니다.
구글과 MS가 중국에 GPU를 클라우드 서비스로 우회 제공하며 수출 규제를 피해간 사례를 통해, 첨단 기술과 국제 규제의 복잡한 현실을 알 수 있습니다. AI가 영화 스토리를 매번 다르게 만들어내는 신기한 변화도 함께 살펴보며, 기술 발전이 문화 콘텐츠에 미치는 영향까지 자연스럽게 이해할 수 있는 내용입니다.
AI가 만든 최초의 극장용 영화는 제작자가 정한 규칙 안에서 장면이 랜덤으로 조합되는 방식입니다. 아직 초기 단계지만, AI 발전에 따라 맞춤형 스토리가 가능해져 보는 사람마다 다른 이야기를 경험할 수 있다는 점이 흥미롭습니다. AI 영상의 퀄리티가 점점 높아지는 모습도 인상적입니다.
관련 링크: 유튜브 바로가기