ChatGPT가 더 이상 성장할 수 없을 거라고 생각한다면 큰 오산입니다. 사실 OpenAI는 이제 막 예열 중입니다.

ChatGPT의 출시가 온라인에서 큰 반향을 불러일으킨 후(그리고 이러한 추세는 여전히 강세를 보이고 있습니다), AI 커뮤니티의 호기심과 관심을 불러일으키는 새로운 유행이 등장했습니다.

아직 사람들이 GPT-3 및 GPT-3.5의 기능에 적응하거나 완전히 이해하지 못했다고 말할 수 있지만, 온라인 상에서 GPT-4가 곧 출시될 것이라는 소문이 돌고 있습니다.

그리고 좋은 소식도 있습니다.

이 글에서는 GPT-4가 무엇인지, 현재 알려진 내용을 요약하고, 이 강력한 AI 모델을 언제, 어떻게 얻을 수 있는지에 대한 새로운 정보를 소개합니다.

계속 지켜봐 주세요!

GPT-4란 무엇인가요?

GPT-4-홈페이지-개방-ai

기술 보고서에서 OpenAI는 GPT-4를 텍스트와 이미지를 받아 텍스트로 변환할 수 있는 대형 멀티모달 모델이라고 설명합니다. 

또한 이러한 모델을 연구하는 것이 중요한 이유는 다음과 같이 실제 세계에서 발견되는 다양한 응용 분야가 있기 때문이라고 주장했습니다:

  • 대화 시스템
  • 텍스트 요약
  • 기계 번역

이것이 바로 지난 몇 년 동안 이러한 모델이 많은 관심을 받고 빠르게 발전한 이유입니다.

하우스오브웹-3-보고서-twitter-post

좀 더 자세히 설명하자면, OpenAI는 자연어 이해와 생산의 개선이 이러한 모델을 개발하는 주요 동기라고 주장합니다.

특히 미묘하고 복잡한 시나리오에서 더욱 그렇습니다.

GPT-4는 어떻게 작동하나요?

문서에서 다음 토큰을 예측하기 위해 GPT-4는 트랜스포머 스타일 모델로 두 가지를 모두 고려합니다:

  • 온라인에서 찾은 데이터와 같이 대중이 자유롭게 액세스할 수 있는 정보 및
  • 외부 출처의 라이선스 정보.

그런 다음 사람의 입력과 사람의 피드백을 통한 강화 학습 (RLHF)을 통해 모델을 미세 조정했습니다.

또한 경쟁이 치열하고 GPT-4와 같은 대규모 모델 운영과 관련된 내재적 위험을 고려할 때 보고서에서 아키텍처에 대해 자세히 다루지 않은 것은 이해할 수 있습니다.

즉, OpenAI의 보고서에는 다음과 같은 세부 정보가 제공되지 않습니다:

  • 모델의 크기
  • 하드웨어
  • 교육 컴퓨팅
  • 데이터 세트 구축
  • 교육 방법 등

하지만 GPT-4의 기능을 더 자세히 살펴볼 수 있는 주요 데이터가 있습니다.

예를 들어, OpenAI는 GPT-4가 유사한 시나리오에서 어떻게 작동하는지 확인하기 위해 인간을 대상으로 개발된 일련의 테스트를 거쳤다고 밝혔습니다.

흥미롭게도 GPT-4는 이러한 테스트에서 상당히 좋은 성적을 거두며, 때로는 대다수의 사람들보다 "더 잘 해내는" 경우도 있습니다.

예를 들어, GPT-4는 모의 변호사 시험에서 만점을 받아 응시자 중 상위 10%에 속합니다.

반면에 GPT-3.5는 하위 10%에 속합니다.

하지만 GPT-4의 기능을 좀 더 자세히 살펴보겠습니다.

GPT-4 기능

이 섹션에서는 다양한 테스트 세트를 통해 입증된 GPT-4 기능의 3가지 중요한 측면을 다룹니다.

자세히 알아봅시다!

1. GPT-4 대 인체 테스트

객관식 및 자유 응답형 시험 문제로 구성된 공개 소스 테스트인 GPT-4에 대한 OpenAI의 모의 인간 테스트.

일부 카테고리별 제안에는 시각적 요소도 포함되어 있습니다.

또한, 결과는 미공개 모의고사와 참가자들의 검증 시험 점수를 기반으로 했습니다.

각 시험의 총점은 객관식 및 자유 응답 결과를 합산하여 계산되었습니다.

이러한 표준화된 테스트의 대부분은 인간도 쉽게 통과할 수 있을 정도로 간단합니다.

하지만 놀랍게도 GPT-4는 통일 변호사 시험의 모의고사 버전에 응시한 전체 응시자 중 상위 10%에 속합니다.

꽤 인상적이지 않나요?

또한 모델의 시험 응시 능력은 주로 사전 교육 단계의 산물이며 RLHF는 이와 거의 또는 전혀 관련이 없는 것으로 보입니다.

실제로 RLHF 모델은 모든 시험 시험에서 기본 GPT-4 모델과 객관식 문제에서 비슷한 성능을 발휘합니다.

하지만 이제 상황이 흥미로워지기 시작합니다.

2. GPT-4 대 GPT3.5

언어 모델 평가에 동일한 업계 표준 메트릭을 사용하여 OpenAI는 GPT-4 기준 모델도 테스트했습니다.

테스트 데이터가 트레이닝 세트에 포함되었는지 확인하기 위해 모든 GPT-4 벤치마크에 대해 몇 번의 샷 프롬프트를 사용하고 보고된 각 벤치마크에 오염이 있는지 확인했습니다.

대부분의 경우, GPT-4는 일반적으로 특정 기준에 따라 작성되고 학습된 최신 언어 모델과 일반적으로 특정 벤치마크에 따라 작성되거나 학습된 과거의 최첨단(SOTA) 시스템 모두에서 성능이 뛰어납니다.

또한 GPT-4는 사용자의 의도를 이해하는 측면에서 이전 버전에 비해 크게 개선되었습니다.

GPT-4-VS-GPT-3-5

또한, ChatGPT와 OpenAI API 를 통해 제출된 5,214개의 질문 세트에서 GPT-4가 GPT-3.5를 큰 차이(70.2% 포인트)로 앞질렀습니다.

또한 GPT-4와 같은 모델을 평가하기 위해 OpenAI는 샘플 단위로 모델 성능을 검사하는 벤치마크를 생성하고 실행하는 프레임워크인 Evals7을 개발하고 있습니다.

평가는 현재 벤치마크와 호환되므로 실제 모델 성능을 모니터링할 수 있습니다.

좋은 소식은 OpenAI가 이러한 벤치마크의 다양성을 점차 늘려 더 광범위한 잠재적 문제와 까다로운 작업 세트를 더 잘 표현할 계획이라는 점입니다.

3. GPT-4 대 시각 입력

텍스트 전용 옵션 외에도 GPT-4는 이미지 프롬프트를 통해 상상할 수 있는 모든 언어 또는 시각 작업을 수행하도록 지시할 수 있습니다.

이 모델은 텍스트와 이미지의 모든 조합을 포함할 수 있는 입력을 기반으로 텍스트 출력을 생성합니다.

즉, GPT-4는 텍스트 전용 입력에서와 마찬가지로 여러 도메인에 걸쳐 동일한 기능을 표시합니다.

여기에는 텍스트와 사진, 다이어그램, 스크린샷 등 텍스트와 이미지가 포함된 혼합 미디어 문서가 포함됩니다.

GPT-4-비주얼

원래 언어 모델을 위해 개발된 몇 개의 샷 프롬프트 및 연쇄 사고와 같은 테스트 시간 방법은 이미지와 텍스트를 사용할 때도 똑같이 효과적입니다.

그러나 이러한 장점에도 불구하고 GPT-4는 이전 GPT 버전과 동일한 약점을 공유합니다

이러한 약점 중 하나는 완전히 신뢰할 수 없다는 것입니다(사실을 '환각'하고 추론 오류를 범함). 

그러나 GPT-3.5 모델에 비해 GPT-4는 환각을 크게 줄이며 다음과 같은 점수를 얻습니다. 최신 GPT-3.5보다 19% 포인트 더 높음 보다 19% 더 높은 점수를 받았습니다.

GPT-4 안전 지표 및 제한 사항

OpenAI는 다음을 포함하여 GPT-4의 많은 안전 기능을 크게 개선했습니다:

  • GPT-4는 허용되지 않는 콘텐츠 요청에 응답할 확률이 GPT-3.5보다 82% 낮습니다
  • OpenAI의 규칙에 따라 GPT-4는 "다치는 방법" 또는 "의료 도움을 받는 방법"과 같은 민감한 질문에 29% 더 높은 확률로 대답할 수 있습니다. 
  • RealToxicityPrompts 데이터 세트에서 GPT-4는 0.73%의 시간 동안만 독성 콘텐츠를 생성 하는 반면, GPT-3.5는 6.48%의 시간 동안만 독성 콘텐츠를 생성 합니다.
GPT-4-프롬프트 예제

OpenAI를 사용하면 사람들이 잘못된 행동을 하도록 영향을 주기가 더 어려워지지만, 여전히 가능합니다. 

트위터는 보고서에서 적대적인 시스템 메시지로 '탈옥'을 예로 들었는데, 이는 여전히 트위터 운영원칙을 위반하는 콘텐츠를 만드는 데 사용될 수 있습니다. 

그러나 이러한 제한 사항을 오남용 모니터링 및 신속한 반복 모델 개선을 위한 파이프라인과 같은 배포 시 안전 조치와 결합하는 것이 중요하다고 지적합니다.

GPT-4에 대한 OpenAI의 주요 시사점

마지막으로, 이 강력한 모델의 목표를 설정할 때 기억해야 할 몇 가지 핵심 사항을 GPT-4에 대한 OpenAI의 기술 보고서에서 강조했습니다. 

몇 가지 예는 다음과 같습니다:

✔️ GPT-4는 엄격한 전문 및 학술 벤치마크에서 인간과 동일한 성능을 발휘하는 대형 멀티모달 모델입니다.

✔️ GPT-4는 여러 NLP 작업(종종 작업별 미세 조정을 포함)에서 대규모 언어 모델과 대부분의 최신 시스템보다 성능이 뛰어납니다.

✔️ 영어로 측정되었지만 향상된 GPT-4 기술은 다양한 언어로 표시될 수 있습니다.

✔️ 예측 가능한 스케일링은 GPT-4의 손실과 행동을 정확하게 예측할 수 있습니다.

✔️ GPT-4의 능력은 위험을 증가시킵니다.

✔️ 그들은 안전성과 정렬을 개선하기 위한 방법과 결과를 제공했습니다.

✔️ GPT-4는 안전하고 널리 보급된 AI 시스템을 향한 중요한 단계입니다.

마지막으로 가장 중요한 정보인 GPT-4 출시일을 잊지 마세요.

GPT-4 출시일

OpenAI는 3월 14일에 대규모 멀티모달 모델인 GPT-4의 출시를 선언했습니다. 

사용자들은 챗봇에게 코드 생성을 요청하는 것만으로 출시 후 몇 시간 만에 테트리스, 커넥트 포, 스네이크, 퐁의 거의 완벽한 버전을 만들 수 있었다고 보고했습니다.

javi-lopez-twitter-post

단, GPT-4는 매월 20달러를 지불하고 ChatGPT Plus를 구독하는 사용자만 사용할 수 있으며, 사용자에게 OpenAI의 언어 모델에 대한 독점 액세스 권한이 부여됩니다. 

또한, 이 구독을 사용하더라도 사용자당 4시간마다 100개의 메시지로 제한되므로 액세스 권한이 제한될 수 있습니다.

마지막 한마디

여기에서는 GPT-4에 대한 OpenAI 보고서의 극히 일부만 다루고 있지만, 적어도 추가 업데이트가 있을 때까지는 올바른 방향으로 나아가는 데 도움이 되기를 바랍니다.

GPT-4는 계속 발전할 것이며, 앞으로 더욱 놀라운 업적을 달성할 것입니다.

하지만 AI 모듈의 잠재력은 의심할 여지없이 방대하지만 때때로 무섭다는 사실도 부인하기 어렵습니다.

또한 이러한 발전으로 인한 불가피한 변화에도 불구하고 원래의 의도에 충실하면서 시대에 발맞추기 위해 노력하는 현재 사용 가능한 AI-기반 도구에 대해 알아보는 것도 중요합니다.

이러한 도구 중 하나가 TextCortex 애드온입니다.

TextCortex 란 무엇인가요?

TextCortex 는 작가가 아이디어를 생성하고 고품질 콘텐츠를 제작할 수 있도록 사용 사례 모듈 개념을 기반으로 구축된 인공지능(AI) 글쓰기 도구입니다.

주요 목적은 다음과 같은 도구를 제공하여 작가가 글쓰기 블록을 극복할 수 있도록 돕는 것입니다:

✒️ 재작성 도구 - 재작성, 요약, 어조 변경, 번역 및 의역의 기타 측면에 대한 지원을 제공합니다.

✒️ 긴 형식 기능 - 5단어 아이디어로 최대 300단어로 구성된 blog post 을 생성할 수 있습니다.

✒️ 글머리 기호를 이메일로 변환 - 글머리 기호를 서식 있는 이메일 메시지로 쉽게 변환할 수 있습니다.

✒️ 제노 모드 - 초기 초안을 기반으로 가장 적절한 결과를 생성합니다.

✒️ 브레인스토밍 기능 - 글쓰기를 시작할 수 있도록 설계된 기능 카테고리입니다.

✒️ AI templates - 키워드와 사전 정의된 templates 으로 모든 콘텐츠를 쉽게 만들 수 있습니다.

✒️ 제노 채팅 - AI 작가와 채팅하고 원하는 결과를 얻으세요.

왜 고려해야 할까요?

매일 10개의 무료 창작물이 제공되는 부분 유료화 계정을 제공합니다.

가입할 때 신용카드 정보를 제공하지 않아도 됩니다.

저희 솔루션은 이미 1만 명 이상의 사용자에게 성공적으로 서비스를 제공하고 있습니다.

합리적인 가격의 프리미엄 요금제로 업그레이드할 수 있습니다.

무료 탑승에 관심이 있으신가요?

Chrome extension 을 다운로드하여 오늘부터 TextCortex 이 어떻게 여러분의 글을 2000개 이상의 플랫폼에서 매력적이고 효과적인 콘텐츠로 쉽게 변환할 수 있는지 알아보세요.