구글은 2023년 12월 6일 인류의 발전과 삶의 질 향상에 기여하기 위해 설계된 최신 AI 기술인 제미니를 출시했습니다. 제미니는 최첨단 기능을 통해 일상적인 업무부터 분야별 요구사항까지 폭넓게 활용될 수 있습니다. 구글 제미니는 벤치마크와 실제 애플리케이션 모두에서 기존 AI 모델을 뛰어넘는 성과를 거두었습니다.

이 글에서는 구글 제미니가 무엇이며 어떤 기능을 가지고 있는지 알아보세요!

TL;DR

  • 제미니는 구글의 가장 최신의 가장 뛰어난 기능을 갖춘 AI 멀티모달입니다.
  • Gemini는 3가지 크기로 제공됩니다: 나노, 프로, 울트라.
  • Google은 AI Studio 및 Vertex AI를 통해 일부 사용자가 사용할 수 있는 Gemini 1.5 Pro의 컨텍스트 창 용량을 100만 토큰으로 늘렸습니다.
  • Gemini는 코드, 비주얼, 오디오, 비디오를 포함한 웹 문서와 서적에 대한 교육을 받았습니다.
  • Google 제품에서 Gemini Nano 및 Gemini Pro에 액세스할 수 있습니다.
  • 구글 제미니 앱 페이지에서 제미니 프로를 체험할 수 있습니다.
  • 제미니의 성능은 GPT-4보다 약간 더 좋습니다.
  • 쌍둥이 자리는 강력한 추론, 수학, 코딩, 언어 이해 능력을 갖추고 있습니다.
  • Gemini는 서면, 시각, 오디오 및 비디오 입력 또는 출력을 지원합니다.

Google 제미니란 무엇인가요? 

제미니는 구글의 가장 크고 진보된 AI 멀티모달입니다. Google Gemini는 텍스트, 이미지, 코드, 오디오, 동영상 등 다양한 유형의 데이터를 입력으로 분석하여 출력으로 생성할 수 있습니다. 제미니의 멀티모달 기능은 다양한 사용 사례와 새로운 기회를 열어줍니다.

제미니는 누가 만들었나요?

제미니는 구글과 구글의 모회사인 알파벳이 함께 만들고 훈련했으며, 구글의 가장 진보되고 유능한 AI 모델이라고 소개되었습니다. 구글은 제미니를 소개하면서 구글 리서치, 구글 딥마인드, 알파코드 팀의 협업으로 만들어졌다고 밝혔습니다.

세 가지 크기의 구글 제미니

제미니는 Google의 가장 유연한 AI 모델입니다. 데이터 센터에서 모바일 디바이스까지 효율적으로 실행할 수 있습니다. Google의 제미니는 세 가지 크기로 제공됩니다:

  • 제미니 나노: Gemini의 가장 효율적인 모델은 스마트폰과 같은 기기에서 실행되도록 설계되었습니다. Gemini Nano는 두 가지 버전으로 제공됩니다: 1.8B(나노-1)와 3.25B(나노-2). Gemini Nano는 외부 소스 없이 디바이스 내 작업을 수행하도록 설계되어 동급 최고의 성능을 제공합니다.
  • 제미니 프로: 다양한 작업에서 성능에 최적화되고 비용 효율적인 서비스를 제공하도록 설계된 모델입니다. 이 모델은 강력한 추론, 성능, 입력 이해, 수학 및 코딩 기능을 제공합니다. 또한 제미니 프로 모델은 구글 바드를 지원합니다.
  • Gemini Ultra: Gemini Pro 모델이 할 수 있는 모든 작업을 수행할 수 있으며, 복잡한 작업을 처리할 수 있는 고급 추론 및 멀티모달 기술을 갖춘 Gemini의 최상위 모델입니다. 아직 공개적으로 사용할 수 없는 Gemini Ultra는 매우 복잡한 작업을 완료하기 위해 개발되었습니다.
쌍둥이자리 모델

Gemini AI는 어떻게 이용하나요?

제미니는 나노 및 프로 사이즈의 Google 제품에서 사용할 수 있습니다. 또한 Google은 향후 제미니를 검색 엔진, 광고, Chrome 와 같은 Google 서비스에 통합할 예정이라고 발표했습니다.

Google Gemini 앱을 통해서도 Gemini Pro 모델에 액세스할 수 있습니다. Gemini는 고급 추론, 코딩, 계획, 이해 등을 수행하기 위해 특별히 튜닝된 Gemini Pro 버전을 활용하고 있습니다.

구글 제미니 2024

구글 제미니 기능

구글 제미니는 세 가지 크기와 정교한 기능으로 제공됩니다. 지금까지 출시된 AI 모델 중 가장 크고 진보된 모델 중 하나입니다. 구글 제미니는 타사 애플리케이션이 필요 없는 고유한 멀티모달 기능으로 눈에 띕니다. 구글 제미니의 기능을 자세히 살펴보겠습니다.

Google 제미니 성능

구글 제미니는 멀티모달 AI이기 때문에 다양한 작업을 고성능으로 수행할 수 있습니다. 구글 제미니는 텍스트, 이미지, 동영상, 오디오, 코드가 포함된 입력을 이해하여 출력을 생성하는 고성능 멀티모달 AI입니다.

Google의 문서에 따르면 Gemini Ultra 모델은 MMLU(대규모 멀티태스크 언어 이해), GSM8K 및 MATH와 같은 벤치마크에서 높은 점수를 받았습니다. 실제로 이러한 벤치마크에 따르면 구글 제미니는 GPT-4를 능가하는 성능을 보였습니다.

구글 제미니 성능 벤치마크

Gemini 1.5 Pro

Gemini 1.5 Pro 모델에는 일반적으로 128,000개의 토큰으로 구성된 컨텍스트 창이 포함되어 있습니다. 하지만 오늘부터 일부 개발자 및 엔터프라이즈 고객 그룹은 비공개 미리 보기에서 AI Studio Vertex AI를 통해 최대 100만 토큰 용량의 컨텍스트 창을 사용하여 테스트할 수 있습니다.

여러 가지 머신 러닝의 발전 덕분에 Google은 Gemini 1.0의 원래 용량인 32,000개의 토큰에서 1.5 Pro의 컨텍스트 창 제한을 대폭 확대했습니다. 업데이트된 버전은 이제 프로덕션 중에 최대 1백만 개의 토큰을 처리할 수 있습니다.

학습된 데이터

모든 크기의 Gemini는 코드, 이미지, 오디오, 비디오를 포함한 웹 문서와 책의 데이터 세트에 대해 학습됩니다. 또한 Gemini의 작은 사이즈는 더 높은 성능과 정확도를 위해 훨씬 더 많은 토큰으로 훈련되었습니다. Google은 Gemini를 학습시키는 데 사용되는 데이터에 품질 필터를 적용하여 유해한 데이터로 학습되는 것을 방지했습니다.

멀티모달

구글 제미니는 텍스트 기반 작업에만 국한되지 않습니다. 시각, 비디오, 오디오 관련 데이터도 처리할 수 있습니다. 구글 제미니는 OCR(객체 문자 인식) 시스템의 지원 없이도 멀티모달 벤치마크에서 높은 점수를 획득할 수 있었습니다. 즉, 구글 제미니는 아무런 지원 없이도 이미지 속 텍스트를 이해하고 분석하여 결과물을 생성할 수 있습니다.

멀티모달에 쌍둥이자리

구글 제미니는 다양한 유형의 입력을 이해하고, 일치시키고, 분석하며, 수집한 정보를 바탕으로 출력을 생성할 수 있습니다. 이 기능은 일상적인 작업부터 전문적인 작업까지 다양한 사용 사례에 유용합니다.

쌍둥이자리 멀티모달 AI

추론 및 입력 이해

Gemini는 고급 추론 기능을 통해 복잡한 서면 및 시각적 입력을 이해할 수 있습니다. 또한, 이러한 기능 덕분에 Gemini는 수천 개의 문서를 스캔하여 사용자가 필요로 하는 데이터를 수집하고 이를 사용하여 결과물을 생성할 수 있습니다. 수작업으로 오랜 시간이 걸리는 데이터 분석 및 데이터 관리 작업을 제미니를 사용하면 몇 분 안에 완료할 수 있습니다. 또한 Google Gemini는 시각적 데이터를 분석하고 사용자의 지시에 따라 새로운 시각 자료를 생성할 수 있습니다.

쌍둥이자리 AI 벤치마크

고급 코딩: 알파코드 2

코딩에 관해서는 제미니는 고급 수학 및 추론 능력 덕분에 복잡한 코딩 작업을 완료하고 복잡한 문제를 해결할 수 있다고 말할 수 있습니다. 제미니는 간단한 모바일 애플리케이션을 만드는 것과 같은 기본적인 코딩 작업은 1분 이내에 완료할 수 있지만, 경쟁이 치열한 코딩 작업은 높은 정확도로 완료할 수 있습니다.

코딩하는 쌍둥이자리

Google의 기사에 따르면 Gemini로 구동되는 AlphaCode 2 모델은 이전 버전인 AlphaCode보다 두 배나 많은 문제를 해결했습니다. 즉, Gemini를 사용하면 고급 코딩 작업을 완료하고 어려운 문제를 빠르게 해결할 수 있습니다. 따라서 Gemini는 코딩, 추론, 수학 과제에서 인상적인 조력자가 될 수 있습니다.

안전

구글은 제미니를 개발하는 동안 비윤리적인 AI 사용을 방지하기 위해 구글의 AI 원칙을 준수했습니다. Google의 AI 원칙에 따르면 AI 모델은 사회적으로 유익한 영향을 미치고 불공정한 편견을 만들지 않아야 합니다. 따라서 제미니는 비윤리적이거나 유해한 결과를 생성하지 않습니다.

TextCortex - 완전 맞춤형 AI 부조종사

제미니 모달은 많은 기능을 제공하지만, 사용자의 목소리를 인식하고 사용자에 대해 알고 있는 완전한 개인화된 AI 비서가 되기에는 부족해 보입니다. TextCortex 은 사용자의 일상적인 작업을 지원하도록 설계된 AI 비서입니다. TextCortex 를 사용하면 텍스트를 생성하고, 기존 작업을 다양한 목소리 톤으로 의역하는 등의 작업을 수행할 수 있습니다.

TextCortex 는 웹 애플리케이션과 브라우저( extension)로 제공됩니다. 브라우저( extension )는 30,000개 이상의 웹사이트 및 앱과 통합되어 있어 인터넷 여정 내내 함께할 수 있습니다.

제노챗 

제노챗은 TextCortex 에서 개발한 대화형 인공지능으로, 인간과 같은 대화와 고급 작문 기능이 돋보이는 제품입니다. ZenoChat은 텍스트 생성부터 웹 검색까지 다양한 기능을 제공합니다. 웹 검색 기능을 통해 ZenoChat은 최신 인터넷 데이터를 사용하여 출력을 생성할 수 있습니다.

제노챗은 "개별 페르소나" 및 "지식 기반" 기능을 통해 완벽하게 사용자 정의할 수 있는 AI 경험을 제공합니다. "개별 페르소나" 기능을 사용하면 ZenoChat의 출력 스타일, 목소리 톤, 개성을 원하는 대로 조정할 수 있습니다. 또한, 저희 개발팀은 12가지의 다양한 페르소나를 ZenoChat에 추가했으니 꼭 사용해 보세요.

"지식 기반" 기능을 사용하면 제노챗이 출력을 생성하는 데 사용할 데이터 세트를 업로드하거나 연결할 수 있습니다. 즉, '지식 기반' 기능을 통해 나만의 인공지능 챗봇을 훈련시킬 수 있습니다. 이 기능을 사용하면 한 번의 프롬프트로 문서를 요약하거나 챗봇과 채팅할 수 있습니다.

제노 어시스턴트

구글 문서나 페이지와 같은 다양한 온라인 워드 프로세서와 통합된 Zeno Assistant는 개요 작성부터 문법 수정까지 글쓰기 과정을 지원하도록 설계되었습니다. 'Alt/Opt + Enter' 단축키를 사용해 모든 텍스트 상자에서 Zeno Assistant를 활성화할 수 있습니다. Zeno Assistant의 일부 기능은 다음과 같습니다:

  • 재작성
  • 요약
  • 더 길게/더 짧게 만들기
  • 언어 간소화
  • 초안 Blog Post /에세이/개요/소셜 미디어 Post
  • 문법 및 맞춤법 수정
  • 계속 쓰기

TextCortex 의 다른 모든 기능과 마찬가지로 제노 어시스턴트는 25개 이상의 언어로 출력을 생성할 수 있습니다.

자동화를 통한 TextCortex

TextCortex 는 make.com과 Zapier를 통해 원활한 자동화 옵션을 제공합니다. integrations. TextCortex 를 사용하면 이메일 작성부터 제품 설명 작성까지 다양한 텍스트 기반 작업을 자동화할 수 있습니다. 이렇게 하면 반복적인 작업에 시간을 낭비하지 않고 비즈니스의 더 중요한 측면에 시간을 투자할 수 있습니다.