[뉴스] 스탠포드가 만든 AI 스마트 안경, 면접 답변이 눈앞에 뜬다면?
스탠포드가 만든 AI 스마트 안경, 면접 답변이 눈앞에 뜬다면?
스탠포드 대학에서 GPT-4와 연동된 AR 스마트 안경을 개발해 면접 질문에 실시간으로 답변을 보여주는 혁신적인 기술이 등장했어요. 이 안경은 음성인식과 이미지 인식을 결합해 대화 내용을 즉시 처리해주는데, 앞으로 면접뿐 아니라 소개팅 등 다양한 상황에서 큰 도움이 될 것 같아요. 한편, AI가 만든 사진이 소니 월드 포토그래피 어워드에서 수상작으로 선정되는 등 AI 기술의 발전이 눈부시게 빠르다는 사실도 흥미롭습니다. 이미지 편집부터 음악 창작까지 AI가 일상 속 창의력을 확장하는 시대, 우리 삶에 어떤 변화를 가져올지 기대가 됩니다.
[영상 정보]
- 영상 제목: 챗GPT 안경, 진짜 사람같은 TTS, 사진 대회 우승한 AI, 영상 생성 AI 혁신 등 최신 AI 뉴스
- 채널명: 조코딩 JoCoding
- 업로드 날짜: 2023-04-25
- 영상 길이: 9:49
[영상에서 사용한 서비스]
- - 유튜브 라이브 영상 : https://youtube.com/live/-xmp1cRMpN8 — AI 클론 싱어 라이브 방송 플랫폼
- - 코딩하는거니 유튜브 채널 : https://www.youtube.com/@gunnycoding — 코딩 관련 영상 제공 유튜브 채널
- - 조코딩 웹사이트 : https://jocoding.net/ — 코딩 공부용 웹사이트
- - 챗GPT 안경 관련 영상 : https://youtu.be/zA1rYccHcW4 — 챗GPT 기능이 탑재된 안경 소개 영상
- - AI 사진 대회 수상 기사 : https://zdnet.co.kr/view/?no=20230419161849 — AI가 수상한 사진 대회 관련 뉴스
- - Inpaint-Anything : https://github.com/geekyutao/Inpaint-Anything — 이미지 인페인팅 오픈소스 프로젝트
- - Anything-3D : https://github.com/Anything-of-anything/Anything-3D — 3D 모델링 관련 오픈소스 프로젝트
- - DINOv2 : https://github.com/facebookresearch/dinov2 — 페이스북 리서치의 비지도 학습 비전 모델
- - StableLM : https://github.com/Stability-AI/StableLM — Stability AI의 오픈소스 언어 모델
- - Whisper JAX : https://github.com/sanchit-gandhi/whisper-jax — 음성 인식 모델 Whisper의 JAX 버전, 70배 빠름
- - Bark TTS : https://github.com/suno-ai/bark — 사람처럼 자연스러운 음성 합성 TTS 모델
- - Colab Stable Diffusion 관련 레딧 글 : https://www.reddit.com/r/StableDiffusion/comments/12t8tc7/is_colab_ —
- - GPT-4 : https://openai.com/gpt-4 — 대화형 AI 언어 모델, 자연어 처리 및 생성
- - Whisper : https://openai.com/research/whisper — 음성 인식 AI 모델
- - 소니 월드 포토그래피 어워드 : https://www.worldphoto.org/sony-world-photography-awards — 국제 사진 공모전
- - 샘(SAM, Segment Anything Model) : https://segment-anything.com/ — 메타에서 공개한 이미지 세그멘테이션 AI 모델
- - 메타(Meta) 오픈소스 프로젝트 : https://github.com/facebookresearch/segment-anything — 메타가 공개한 AI 관련 오픈소스, 세그멘테이션 모델 등
[주요 내용]
스탠포드에서 개발한 AR 스마트 안경은 GPT-4와 음성인식 기술을 결합해 면접 질문에 실시간으로 답변을 보여줍니다. 마치 머릿속에 조용한 조력자가 있는 듯한 신기한 경험을 선사해, 앞으로 면접 문화가 어떻게 변할지 궁금해지게 만드는 흥미로운 기술입니다.
렌즈 속에 AI가 투입되어 면접이나 소개팅에서 음성과 이미지까지 인식하며 자연스럽게 소통을 돕는 미래 기술을 상상해보세요. 개발자들의 일상과 연애까지 따뜻하게 지원하는 새로운 안경 시장의 가능성을 친근하게 풀어낸 이야기입니다.
소니가 주최하는 세계 사진전에서 AI가 만든 사진이 전문가 심사를 통과해 수상작으로 선정되었어요. 겉보기엔 진짜 사진과 구분이 어려울 정도로 AI 기술이 놀랍게 발전한 모습을 보여주며, 사진뿐 아니라 그림과 음악 분야까지 AI의 영향력이 점점 커지고 있답니다.
샘의 공개된 AI 모델 ‘세그먼트 애니씽’ 덕분에 이미지 수정이 훨씬 쉬워졌어요. 원하는 객체를 선택해 한 번에 지우거나 바꾸는 인페인팅 기술이 눈에 띄게 발전해, 마치 마법처럼 사진 편집이 간편해진 느낌입니다. AI가 일상의 창작을 한층 더 가깝게 만들어주는 변화가 흥미롭게 다가와요.
참호부터 버스까지, 일상을 바꾸는 AI 기술의 빠른 발전과 메타의 오픈소스 공개로 3D 변환이 손쉽게 가능해진 이야기를 따뜻한 시선으로 전해드립니다.
3D 모델링이 일상 속으로 성큼 다가온 느낌이에요. 의자, 강아지, 햄버거 얼굴까지 자유롭게 선택하고 뽑아내는 과정이 마치 나만의 작은 세상을 만드는 것 같죠. 특히 오픈 소스로 공개된 샘 모델과 페이스북의 디노 v2 같은 최신 기술들이 어떻게 우리 삶에 스며들지 기대하게 만듭니다. 다만 커머셜 라이선스 제한은 조금 아쉽지만, 앞으로 더 다양해질 3D 모델링의 가능성에 설레는 순간입니다.
오픈 소스 AI가 공개되면서 누구나 쉽게 활용할 수 있는 시대가 열렸어요. 특히 테이블 디퓨전과 테이블 LM 같은 혁신적인 언어 모델이 등장해 앞으로 어떤 변화가 올지 기대하게 만듭니다. 작은 공개가 큰 발전으로 이어지는 순간을 함께 지켜보는 기분이에요.
오픈 소스로 공개된 랭귀지 모델은 누구나 무료로 써볼 수 있지만, 아직 파라미터 수가 작아 성능은 아쉽다는 후기가 많아요. GPT3처럼 고성능 모델은 API로만 접근 가능해 직접 사용이 어렵지만, 앞으로 더 큰 규모의 모델 공개 계획이 있어 기대를 모으고 있습니다. AI 개발 문턱을 낮추려는 시도가 느껴져서 흥미롭게 다가왔어요.
1750억 개 파라미터급 AI 모델이 오픈소스로 공개되면서, 더 빠르고 저렴하게 인공지능을 훈련할 수 있는 가능성이 열렸어요. 환경 부담도 줄이고 커뮤니티의 기대와 우려가 공존하는 가운데, AI 발전의 새로운 물결이 조용히 다가오고 있답니다.
오픈 소스 AI 모델 ‘위스퍼’가 음성을 텍스트로 빠르고 정확하게 변환하며, 공개 덕분에 다양한 응용과 발전이 활발히 이루어지고 있어요. 기술이 선순환하며 더 나은 AI 환경을 만들어가는 모습이 인상적입니다.
위스퍼 모델이 잭스 적용으로 70배 빨라지면서 음성 인식 속도의 새로운 가능성이 열렸어요. 하드웨어 환경에 따라 차이가 있지만, 오픈소스 음성 인식과 텍스트 투 스피치 기술 발전에 희망을 주는 변화라서 흥미롭게 다가왔습니다.
한국어와 영어의 미묘한 뉘앙스 차이를 섬세하게 짚어주며, 명절 추석처럼 소중한 시간을 가족과 함께 보내는 따뜻한 순간을 떠올리게 합니다. 스테이블 디퓨저 같은 최신 AI 기술의 발전과 한계도 자연스럽게 녹여낸 이야기라 더욱 흥미로워요.
구글 콜랩의 무료 GPU 사용이 갑자기 제한되면서, 코딩 초보자들도 많이 쓰던 스테이블 디퓨저 활용에 변화가 생겼어요. 너무 많은 사용으로 비용 부담이 커진 구글의 현실을 이해하게 되는 대목입니다.
구글이 스테이블 디퓨전 리모트 UI 접속을 막으면서 AI 이미지 생성 활용에 변화가 생겼어요. 갑작스러운 정책 변경이 아쉽지만, 어도비 파이어플라이가 프리미어 프로에 적용되며 새로운 가능성을 열어준다는 소식도 함께 전해집니다.
프리미어 프로와 파이어플라이가 만나 영상 편집이 훨씬 쉬워졌어요. 텍스트만 입력하면 자동으로 자막을 넣고, 얼굴 인식으로 밝기 조절까지 척척! 마치 마법처럼 스토리보드까지 만들어주는 신기한 기능 덕분에 영상 작업이 한결 부드러워진 느낌입니다.
텍스트만으로도 영화 같은 고퀄리티 영상을 미리 만들어내는 AI 기술의 놀라운 발전을 친근하게 풀어낸 이야기입니다. 과거 복잡한 CG 작업 없이도 이제는 손쉽게 영상 제작이 가능해진 시대를 실감하게 해주죠. AI가 만들어내는 영상이 점점 더 진짜처럼 느껴지는 신기한 경험을 함께 나눠보세요.
관련 링크: 유튜브 바로가기