[뉴스] 사진 한 장으로 상상 그 이상, AI가 만든 나만의 게임 세상
사진 한 장으로 상상 그 이상, AI가 만든 나만의 게임 세상
구글 딥마인드에서 ‘지니’라는 놀라운 게임 생성 AI를 공개했어요. 1) 사진 한 장만 있으면 2) 이미지 속 캐릭터와 배경을 자동으로 인식해 3) 바로 플레이 가능한 게임으로 만들어 줍니다. 심지어 스케치나 합성 이미지도 가능하고, 학습 과정에서 20만 시간 이상의 게임 영상을 활용해 별도의 라벨링 없이도 캐릭터와 장애물을 구분해내는 점이 정말 신기하죠. 이 기술은 단순한 게임 제작을 넘어, 로봇 시뮬레이션이나 다양한 AI 훈련 데이터로도 활용될 수 있어 앞으로 AI와 게임, 로봇 분야에 큰 변화를 가져올 것으로 기대됩니다. AI 게임 생성에 관심 있다면 꼭 알아두면 좋은 내용이에요!
[영상 정보]
- 영상 제목: AI 뉴스 - 구글 게임 생성 Genie, 노래 부르는 AI EMO, 이디오그램 업데이트, 제미나이 음모론 등
- 채널명: 조코딩 JoCoding
- 업로드 날짜: 2024-03-04
- 영상 길이: 19:37
[영상에서 사용한 서비스]
- - 조코딩 : https://jocoding.net/ — 코딩 공부 및 AI 뉴스 제공 웹사이트
- - 조카소 : https://jocasso.codemafia.io — 자막, 번역, 더빙 AI 및 웨딩 AI 서비스
- - 한빛미디어 : https://hanb.link/1aqK — 챗GPT API 활용 수익형 웹 서비스 관련 도서 판매
- - 교보문고 : https://hanb.link/1aqL — 도서 판매 플랫폼
- - 예스24 : https://hanb.link/1aqM — 도서 판매 플랫폼
- - 알라딘 : https://hanb.link/1aqN — 도서 판매 플랫폼
- - 구글 Genie : https://sites.google.com/view/genie-2024 — 구글의 AI 비서 서비스
- - EMO : https://humanaigc.github.io/emote-portrait-alive/ — 사진 한 장으로 말하고 노래하는 영상 생성 AI
- - 이디오그램 : https://www.aitimes.com/news/articleView.html?idxno=157600 — 이미지 생성 AI 모델
- - 소라 (Sora) : https://twitter.com/ProperPrompter/status/1764138121141068259 — AI 영상 생성 및 음성 기능 추가된 서비스
- - 피카랩 (Pikalab) : https://www.aitimes.com/news/articleView.html?idxno=157560 — 영상에 음성 기능 추가한 AI 서비스
- - 제미나이 (Gemini) : https://www.aitimes.com/news/articleView.html?idxno=157557 — 구글의 차세대 AI 모델
- - 메타 이메진 (Meta Imagine) : https://n.news.naver.com/mnews/article/092/0002323122 — 메타의 이미지 생성 AI
- - 구글 딥마인드 지니 (Google DeepMind Genie) : https://deepmind.com/ — 이미지 한 장만으로 게임을 생성하는 AI 플랫폼
[주요 내용]
구글 딥마인드의 ‘지니’는 단 한 장의 이미지나 스케치만으로도 자동으로 게임을 만들어 줍니다. 1) 이미지 준비 2) AI에 입력 3) 바로 플레이 가능한 게임 완성! 20만 시간 이상의 게임 영상을 학습해 상상력까지 더하는 놀라운 생성 AI 기술을 쉽게 경험해 보세요.
사진 한 장만으로 캐릭터와 배경을 구분해 자동으로 게임화하는 AI 기술이 놀랍습니다. 1) 이미지 분석 2) 캐릭터 인식 3) 배경 구분 4) 움직임 생성까지 가능해, 스케치나 사진도 쉽게 게임 속 주인공으로 변신시킬 수 있어요.
게임처럼 시뮬레이션 환경을 생성해 로봇 움직임 데이터를 얻고, 이를 활용해 다양한 상황에 대응하는 AI 에이전트를 훈련하는 방법을 쉽게 이해할 수 있어요. 1) 시뮬레이션 생성 2) 데이터 수집 3) AI 학습 단계로 실험실 세팅 없이도 효율적인 로봇 훈련이 가능하다는 점이 인상적입니다.
옛날 사진 한 장으로 자연스럽게 노래하고 말하는 AI 영상 생성법을 소개합니다. 1) 사진 입력 2) 레퍼런스 음악 선택 3) AI가 생생한 영상 완성. 기존 기술보다 훨씬 자연스러운 결과를 경험할 수 있어요.
말하는 자연스러움이 크게 향상된 AI 음성 기술과 빠르게 발전하는 이미지 생성 AI를 살펴보세요. 1) 음성 자연스러움 비교 2) 공개 지연 이유 3) 유사 모델 등장 가능성 4) 타이포그래피 이미지 생성 업그레이드까지 친절하게 정리했습니다.
AI가 글씨와 이미지를 자연스럽게 결합해 로고나 타투 디자인까지 쉽게 만들 수 있는 신기한 타이포그래피 생성 모델을 소개합니다. 1) 이미지 생성 2) 글씨 표현 3) 디자인 활용까지 간단하게 경험해보세요.
AI 이미지 생성기로 영어 로고와 글씨를 깔끔하게 만들 수 있는 방법을 보여줘요. 한글은 아직 완벽하지 않지만, 제품 디자인이나 유튜브 채널 아트 작업에 활용하기 좋습니다. 1) 영어 텍스트 입력 2) 이미지 생성 3) 결과 확인으로 쉽게 시도해보세요.
무료로 하루 100장까지 아트적인 영어 글씨와 이미지를 만들 수 있어요. 1) 아트 글씨 활용 2) 이미지 100장 생성 3) AI 음악 결합까지 경험해보세요. 신비로운 영상과 함께 창의력을 키우기에 딱 좋답니다.
쭉 날아다니는 장면을 일관되게 만들면서 수백 점의 그림과 조각상이 한꺼번에 표현되는 놀라운 영상 제작 과정. 눈동자 디테일까지 섬세하게 구현해 CG 작업의 한계를 뛰어넘는 신기한 기술을 보여줍니다. 매주 새롭게 공개되는 영상들이 영화 제작 방식을 바꾸고, 실제로 대규모 영화 제작 시설 확장을 포기하게 만든 영향력도 흥미롭습니다.
AI 기술 덕분에 대규모 세트장 없이도 영화 제작이 가능해졌어요. 1) 세트장 신축 계획 2) AI 활용 충격 3) 비용 절감과 수익 향상 4) 일자리 변화 고민 5) 새로운 엔터테인먼트 시설 개발까지, 영화 산업의 미래를 쉽게 이해할 수 있는 이야기입니다.
놀이동산 같은 엔터테인먼트 시설은 AI로도 쉽게 대체하기 어려워요. 1) 직접 체험하는 재미 2) 감성적 연결 3) 현장감 있는 즐거움 덕분에 앞으로도 특별한 가치가 계속될 것 같아요. AI 시대에도 사람만의 놀이 경험은 소중하다는 점을 잘 보여줍니다.
스타트업이 빠르게 성장하려면 1) 기존 기술 활용 2) 오픈AI 모델 적용 3) 효율적 서비스 운영이 중요해요. 압도적 기술력 앞에선 하위 호환일 수 있지만, 똑똑한 전략으로 충분히 경쟁력을 키울 수 있다는 점을 친절하게 알려줍니다.
최근 AI 이미지 생성 논란과 함께 제미나이 사건이 불러온 음모론이 흥미롭습니다. 1) AI가 흑인과 여성 차별 문제로 지적받음 2) 일부러 불완전한 AI를 만들어 반대 여론 조성 3) 구글이 검색 광고 수익 보호를 위해 전략을 바꿨다는 이야기까지, AI의 한계와 사회적 영향에 대해 생각해볼 기회를 줍니다.
AI 이미지 생성 과정에서 인종 편향 문제가 꾸준히 제기되고 있어요. 구글과 메타 모두 논란을 피하려고 논평을 자제하는데, 데이터 학습 특성상 백인 중심 이미지가 많이 나오는 현상이 반복된다고 합니다. 이런 문제를 미리 지적하며 알고리즘 보정의 필요성을 생각해볼 수 있는 내용이에요.
인종 차별 문제를 줄이기 위해 AI 보정이 필수인 이유와, 7월 출시 예정인 1400억 매개변수 라마 3의 오픈소스 공개 소식을 친절하게 알려드립니다. AI 편향 개선과 최신 기술 동향을 쉽게 이해하는 데 도움되는 내용입니다.
라마 3는 이전 버전보다 더 융통성 있게 답변해줘서 일상 대화가 한결 자연스러워졌어요. 구글 제미나이 울트라는 내년 스마트폰 탑재 예정이라 AI 활용이 더 편리해질 듯합니다. 1) 라마 3 융통성 향상 2) 구글 제미나이 울트라 출시 3) 스마트폰 온디바이스 AI 기대해보세요.
스마트폰에 온디바이스 AI가 탑재되는 시대가 곧 옵니다. 1) 대형 언어 모델을 압축해 2) 칩에 직접 실행 가능하게 만들고 3) 클라우드 의존도를 줄이는 기술 발전 덕분인데요, 마이크로소프트의 비트넷처럼 파라미터를 간단한 숫자로 표현해 효율을 높이는 방법도 함께 주목할 만합니다. AI가 더 가까워지는 느낌, 흥미롭죠!
AI 모델 파라미터를 -1, 0, 1 세 가지 값으로만 표현해 비용과 저장 공간을 크게 줄이는 1비트 LLM 기술을 쉽게 설명해 드려요. 1) 기존 16비트 방식 복잡 2) 단순화된 3값 표현 3) 효율적 컴퓨팅 가능, 이렇게 이해하면 도움이 됩니다.
AI 성능을 높이는 1비트 LM 최적화와 함께, 9천억 투자 유치한 피규어 AI가 오픈AI와 협력해 로봇 인지·추론·상호작용을 강화하는 멀티모달 모델 개발에 나섰습니다.
BMW 공장에 AI 기반 휴머노이드 로봇이 실제 투입되고, 미스트랄의 신형 AI 모델이 GPT-4 수준 성능으로 MS 애저와 협력하며 빠르게 주목받고 있습니다. AI 로봇과 최신 대형 언어 모델 소식을 쉽게 정리해 드려요.
MS가 오픈AI와 미스트랄 AI에 투자하며 AI 경쟁력을 키우고, 유럽의 엄격한 AI 규제 속에서도 미스트랄 AI가 성장할 수 있도록 일부 규제 완화와 로비 활동이 진행된 이야기를 쉽게 정리해 드립니다.
미국 MS 자본 투자받은 AI 스타트업이 국가 간 권력 싸움과 반독점 이슈에 휘말리는 과정을 쉽게 정리해 드려요. 1) 미국 자본 투자 2) 유럽과 미국의 규제 갈등 3) 스타트업 성장과 반발 상황 이해하기
어도비가 선보인 음악 생성 AI ‘뮤직젠’은 단순 멜로디를 힙합 스타일로 바꾸는 등 창작 방식을 새롭게 바꾸고 있어요. 아직 연구 단계지만, AI 음악 시장에 큰 변화를 예고하는 흥미로운 기술입니다. 1) 인풋 멜로디 준비 2) 스타일 변환 3) 결과 확인으로 쉽게 체험 가능해요.
5년 안에 인간 수준 인공지능이 등장할 가능성이 커지고 있습니다. 젠슨 황 CEO가 직접 언급한 이 소식은 AI 발전 속도를 실감하게 하죠. 1) AI 시험 통과 사례 증가 2) 빠른 기술 진화 3) 앞으로의 변화 기대, AI 뉴스에 관심 있는 분들께 꼭 추천합니다.
관련 링크: 유튜브 바로가기