You are currently viewing 구글이 제미니의 강력한 새 업그레이드를 선보였습니다.

구글이 제미니의 강력한 새 업그레이드를 선보였습니다.

제이크 피터슨

2024년 2월 16일

쌍둥이자리 1.5 텍스트

크레딧: Google

구글이 제미니 발표를 연일 쏟아내고 있는 것처럼 느껴진다면 바로 그 때문입니다. 지난주에는 AI 봇인 Bard를 Gemini로 리브랜딩하고 첫 번째 유료 AI 구독 등급인 Gemini Advanced를 출시했습니다. 그 발표에 이어서 Google의 AI 모델의 다음 버전인 Gemini 1.5가 새롭게 출시되었습니다.

Gemini 1.5란 무엇인가요?

Google은 Gemini 1.5가 트랜스포머 및 전문가 혼합(MoE) 아키텍처를 기반으로 구축되었다고 말합니다. 기본적으로 하나의 큰 신경망인 기존의 트랜스포머 아키텍처와 비교하여, MoE 모델은 여러 개의 ‘전문가’ 신경망으로 잘게 쪼개질 수 있다고 Google은 말합니다. 이렇게 하면 주어진 작업에 필요한 경로만 모델에서 활성화되므로 표준 기능보다 훨씬 효율적이라고 Google은 말합니다.

테스터에게 제공되는 Gemini 1.5의 첫 번째 버전은 Gemini 1.5 Pro입니다. ‘프로’는 최대한 다양한 작업과 기기에서 가장 잘 작동하는 Google의 LLM(대규모 언어 모델)의 이름입니다. 가장 강력한 애플리케이션보다는 가능한 한 많은 애플리케이션에서 사용할 수 있도록 설계된 모델인 GPT-3.5와 비슷하다고 생각하면 됩니다.

1.5 Pro에는 표준 128,000개의 토큰 컨텍스트 창이 있지만(GPT-4와 동일), Google은 현재 최대 100만 개의 토큰 컨텍스트 창을 테스트 중이라고 말합니다. 천만에 비해 1.0 Pro는 32,000개입니다. 모델이 실행할 수 있는 토큰이 많을수록 프롬프트가 더 커질 수 있으며, 따라서 모델이 한 번에 처리할 수 있는 요청도 더 커집니다. Google에 따르면 1.5 Pro는 최대 1시간 분량의 동영상, 11시간 분량의 오디오, 30,000줄 이상의 코드(또는 70만 단어 이상)가 포함된 코드베이스를 한 번에 처리할 수 있습니다. (100,000줄 이상의 코드가 포함된 단일 프롬프트도 처리할 수 있습니다.)

1.5 프로는 많은 양의 정보를 이해하고 이에 대한 복잡하고 구체적인 질문에 더 잘 대답할 수 있는 것으로 알려졌습니다. 데모 동영상에서 Google은 1.5 Pro에 아폴로 11호 미션의 402페이지 분량의 기록을 입력하는 예를 보여줍니다. 그런 다음 땅을 가리키는 화살표가 있는 부츠 워킹 스케치를 공유한 후 모델에게 이 이미지의 의미를 물었습니다. 모델은 이 스케치가 닐 암스트롱이 달에 발을 딛는 순간을 묘사한 것임을 알아내고 그의 유명한 명언을 그림에서 찾아낼 수 있었습니다. 또한 무성 영화와 같은 콘텐츠를 분석하여 무슨 일이 있었는지 설명하고 대부분의 시청자가 놓칠 수 있는 작은 순간을 강조할 수 있습니다.

구글은 1.5 프로가 사용하는 테스트 벤치마크의 87%에서 1.0 프로보다 성능이 뛰어나다고 말합니다. 또한 Gemini Advanced를 구동하는 모델인 1.0 Ultra와 “대체로 비슷한 수준”의 성능을 발휘합니다. 또한 추가 프롬프트 없이도 모델이 현재 데이터 세트에서 정보를 가져와 새로운 방식으로 적용할 수 있는 ‘상황에 맞는 학습’ 기능에 만족하고 있습니다.

Gemini 1.5를 사용해 보는 방법

Google은 AI Studio와 Vertex AI를 통해 Gemini 1.5 Pro 평가판을 운영 중이며, 관심 있는 개발자를 위한 대기자 명단을 보유하고 있습니다. 관심이 있는 개발자라면 여기에서 대기자 명단에 등록할 수 있습니다.

Gemini 1.5가 Google의 Gemini 서비스를 통해 널리 제공되면 125,000개의 토큰 창을 무료로 사용할 수 있습니다. 100만 토큰 창에 액세스하려면 유료입니다. (현재 가격은 알려지지 않았습니다.)

답글 남기기