구글 'Gemini' 차세대 멀티모달 AI 공개하며 AI 혁명 본격화
실시간 시각 가이던스·자연어 음성 대폭 강화…
180개국 AI 모드 확산
[AF 에엪 기술융합부] 2025년 8월 중순, 구글은 차세대 대규모 언어 모델인 'Gemini'의 멀티모달 기능을 대폭 강화한 대규모 업데이트를 발표했다.
이는 AI 어시스턴트 시장에서의 주도권을 회복하려는 구글의 강력한 의지를 보여준다. 이번 업데이트의 핵심은 텍스트, 이미지, 영상, 음성을 동시에 이해하고 처리하는 통합 멀티모달 능력으로, 기존의 텍스트 중심 모델들이 가지고 있던 한계를 뛰어넘는 것이 특징이었다. 구글은 8월 한 달 동안 Gemini를 활용한 AI Mode를 180개국으로 확산시켰다고 발표했다. 이는 초기 미국·영국·인도에 한정되었던 서비스가 전 세계 대부분 지역으로 대폭 확대된 것으로, 라틴아메리카를 비롯한 여러 지역에서 영어 기반의 AI 검색이 가능해졌다. 다만 EU 지역은 규제 문제로 인해 여전히 서비스 지역에서 제외된 상태이며, 현재는 영어만 지원하고 다른 언어는 향후 계획으로 남아있다.
Gemini Live, 실시간 멀티모달 기능으로 상호작용 강화
8월 중순에 공개된 'Gemini Drops/August' 자료와 8월 20일 추가 보도에 따르면, 'Gemini Live'의 주요 개선사항은 실시간 카메라 화면 인식을 통한 시각적 강조 기능, 메시지·통화·캘린더 등 구글 앱과의 심층 통합, 그리고 감정과 억양이 더욱 자연스러운 음성 합성 모델의 업그레이드였다. 특히 주목할 만한 기능은 WebSocket을 활용한 'Multimodal Live API'로, 개발자들이 실시간으로 텍스트, 음성, 비디오를 결합한 복합적인 대화형 애플리케이션을 구축할 수 있게 되었다. 이 API는 함수 호출, 코드 실행, 검색 기반 정보 제공, 다중 도구 통합을 하나의 요청으로 처리할 수 있어, 보다 복잡하고 자연스러운 AI 상호작용이 가능해졌다. 이러한 기능은 픽셀 10 등 신형 기기에 우선 적용되었으며, 안드로이드 오토에도 Gemini가 통합되어 차량 내에서 “Hey Google, let's talk”이라는 음성 명령으로 Gemini Live를 활용한 자유로운 대화가 가능해졌다. 특히, 운전자가 한 언어로 말하면 다른 언어로 메시지를 전송하는 실시간 번역 기능은 40개 이상의 언어를 지원했다.
개인화와 멀티모달 생성 기능의 확장
8월 업데이트에는 개인화 기능도 대폭 강화되었다. Gemini 2.5 Pro 모델은 이제 과거 대화를 참조하여 사용자의 선호도, 관심사, 요구사항을 학습하고 맞춤형 응답을 제공했다. 예를 들어, 이전에 사용자의 식단 제한 사항이나 여행 선호도를 언급했다면, 향후 대화에서 이를 자동으로 고려한 답변을 제공하는 식이었다. 또한 프라이버시를 고려한 ‘임시 채팅’ 기능도 도입되었다. 이 기능을 사용하면 일회성 대화가 향후 개인화에 영향을 주지 않아, 사용자가 상황에 따라 선택적으로 활용할 수 있게 되었다. 구글은 멀티모달 생성 AI 분야에서도 상당한 진전을 보였다. ‘Imagen 4’는 2K 해상도까지 지원하는 사실적 이미지 생성이 가능해졌으며, ‘Lyria 2’는 유튜브 쇼츠와 버텍스 AI를 통해 음악을 생성했다. AI 영화 제작 도구인 ‘Flow’도 프로/울트라 구독자에게 실험적으로 제공되었다.
시장 점유율 및 제기된 과제
시장 점유율과 사용자 수치의 경우, 일부 매체에서 언급하는 '8,200만 명 MAU' 등의 수치는 출처별로 편차가 있어 인용에 주의가 필요하다. 구체적인 사용량 수치를 언급할 경우 구글의 공식 발표나 해당 통계 기관의 원자료 확인이 필수적이다. 한편, 연구 차원에서 구글은 ‘Gemini Diffusion’이라는 혁신적인 기술도 공개했다. 하지만 실시간 카메라 접근 권한, 음성 데이터의 로컬 처리 대 클라우드 처리, 그리고 개인정보 보호 등의 과제도 함께 제기되었다. 업계 전문가들은 구글의 이번 업데이트가 실시간 멀티모달 어시스턴트 상용화의 중요한 전환점이 될 것으로 평가하면서도, 보안과 프라이버시 관리가 핵심 과제라고 지적했다.
AF 에엪 기술융합부 press@artfr.co.kr
◎ AF(에엪) https://artfr.co.kr
Copyright © ARTFR.CO.KR, 무단 전재 및 재배포 금지
#AF #에이에프 #에엪 #인공지능 #AI #구글 #Gemini #제미니 #제미나이
'AI - ARTTECH > Overview' 카테고리의 다른 글
오픈AI 'GPT-5' 전격 출시…안전성 주장과 독립 연구진 우회 성공 보고 상충 (1) | 2025.09.10 |
---|---|
마이크로소프트 코파일럿,, 윈도·오피스·NFL 연계 기능 대폭 강화 (2) | 2025.09.08 |
xAI, 사용자 대화 대량 유출 및 반독점 소송 이중고 직면 (2) | 2025.09.06 |
구글, 제미니(Gemini) 로드맵 공식화…멀티모달 및 대규모 문맥 처리에 초점 (1) | 2025.09.05 |
퍼플렉시티 AI, 언론사에 수익 80% 분배하는 'Comet Plus' 출시 (1) | 2025.09.05 |