구글의 새로운 디바이스, 스마트 안경을 공개한다.
최근 구글이 선보인 Gemini AI는 비주얼 인식 분야에서 혁신적인 변화를 이끌고 있습니다. 기존의 인공지능 모델이 이미지, 오디오, 비디오 등 각기 다른 데이터를 따로따로 처리했던 것과 달리, Gemini는 처음부터 멀티모달(다중 모드)로 설계된 것이 특징입니다. 덕분에 사진, 음성, 동영상 등 다양한 정보를 동시에 실시간으로 이해하고 분석할 수 있습니다.구글 Gemini, 비주얼 인식의 새로운 시대를 열다Gemini 2.5 버전은 이미지 인식에서 한 단계 더 진화하여, 단순히 이미지를 인식하는 것을 넘어 객체 감지(이미지 속 사물의 위치와 각 객체의 경계 상자 좌표 제공), 이미지 캡셔닝(사진의 전체 내용을 자연스러운 문장으로 설명), 광학 문자 인식(OCR, 이미지 안의 글자를 텍스트로 변환) 등..