본문 바로가기
카테고리 없음

GPT 시작에서 옴니까지 History

by 스마트파베르 2024. 5. 16.
반응형

OpenAI GPT-1에서 GPT-4o 까지 개발 연혁과 특징을 정리

기본 알고리즘은 구글 브레인팀의 인도 출생 연구원인 '아시시 바스와니( Ashishi Vaswani)' 박사 가 주저자로 2017년 발표한 논문 “Attention is All You Need”의 트랜스포머 이론을 바탕으로 OpenAI는 자연어 처리를 위한 대규모 거대 언어 모델(LLM)을 만들어 왔다.

<모델별 출시 연도 및 주요 특징>

GPT-1 2018 - Transformer 아키텍처 기반
- 1.17억 개의 파라미터
- 단일 방향 언어 모델
- 특정 NLP 작업에서 좋은 성능을 보임
GPT-2 2019 - 15억 개의 파라미터
- 문맥을 더 잘 이해하고 생성하는 능력 향상
- 다양한 작업에 대한 Zero-shot 학습 능력
- 악용 가능성 때문에 제한적으로 공개됨
GPT-3 2020 - 1750억 개의 파라미터
- 광범위한 작업에서 강력한 성능
- Few-shot 및 Zero-shot 학습 능력 강화
- API 형태로 접근 가능
* 2021년 11월 30일에 ChatGPT라는 서비스로 출시한 모델은 GPT-3.5로 봄
GPT-4 2023 - GPT-3 대비 더욱 향상된 이해와 생성 능력
- 멀티모달 기능 (텍스트와 이미지 모두 처리 가능)
- 더욱 정교한 상호작용과 문맥 이해 능력
- GPT-4 Turbo 버전 출시로 비용 효율성 개선
GPT-4 Turbo 2023.11.6 - GPT-4 대비 비용 효율성 개선
- 더 빠른 응답 시간, 대규모 응용 프로그램에 적합한 성능
- 텍스트 및 비전 기능 지원, 128k 컨텍스트 윈도우
- 다양한 비즈니스 및 연구 목적에 최적화

 

이어서, OpenAI는 2024. 5. 13  전격적으로 'GPT-4o(포오)'를 출시.

GPT-4o는 인간과 실시간 음성 대화를 통해 질의답변할 수 있다.  'o'는 모든 것이라는 '옴니'(omni)를 의미한다. 전지전능하겠다는 의지일 수도 있다.

텍스트는 물론, 청각과 시각으로도 추론하고 이를 말할 수 있는 한층 똑똑해진 된 음성 AI 어시스턴트이다.

이용자 질문에대한  응답 시간은 평균 320ms로, 인간의 응답시간과 비슷하다. 이전 모델 GPT-3.5는 평균 2.8초, GPT-4가 응답에 5.4초가 걸렸다. GPT-4o는 사람처럼 대화가 가능하고, 답변 중 끼어들어도 된다.

 

OpenAI가 GPT API 이용 개발자들에게 보낸 GPT-4o 소개 메일 내용.

"안녕하세요,

우리는 API에서 GPT-4 Turbo만큼 스마트하고 훨씬 더 효율적인 새로운 플래그십 모델인 GPT-4o를 출시했습니다. 우리는 다음을 포함하여 모델 효율성의 이점을 개발자에게 전달하고 있습니다.

  • 50% 더 낮은 가격 . GPT-4o는 입력 토큰(100만 개 토큰당 5달러)과 출력 토큰(100만 개 토큰당 15달러) 모두에서 GPT-4 Turbo보다 ​​50% 저렴합니다.
  • 2배 더 빠른 대기 시간. GPT-4o는 GPT-4 Turbo보다 ​​2배 빠릅니다.
  • 5배 더 높은 속도 제한 . 앞으로 몇 주 동안 GPT-4o는 GPT-4 Turbo의 5배로 증가하여 사용량이 많은 개발자의 경우 분당 최대 1,000만 개의 토큰을 처리할 수 있습니다.
API의 GPT-4o는 현재 텍스트 및 비전 기능을 지원합니다. GPT-4 Turbo에 비해 더 나은 비전 기능과 영어 이외의 언어에 대한 지원이 향상되었습니다. 128k 컨텍스트 창이 있고 지식 마감 날짜는 2023년 10월입니다. 우리는 앞으로 몇 주 안에 소수의 신뢰할 수 있는 파트너에게 API에서 GPT-4o의 새로운 오디오 및 비디오 기능에 대한 지원을 시작할 계획입니다.

GPT-4 또는 GPT-4 Turbo를 사용하는 개발자는 GPT-4o로 전환하는 것을 고려하는 것이 좋습니다. Chat Completions API  Assistants API 에서 GPT-4o에 액세스하거나 24시간 이내에 비동기적으로 완료된 일괄 작업에 대해 50% 할인을 받을 수 있는 Batch API 에서 액세스할 수 있습니다.

시작하려면 현재 비전 기능을 지원하는 Playground 에서 모델을 테스트하고 API 문서를 확인하세요. 지금 GPT-4o로 비디오 콘텐츠를 입력하기 위해 비전을 사용하는 방법을 알아보려면 GPT-4o 소개 쿡북을 확인하세요. 질문이 있는 경우 OpenAI 개발자 포럼 에 문의하세요."

 

AI Assistant 라는 말은 최초로 스티브 잡스가 만든 애플의 'Siri'가 효시이다.  스티브 잡스가 원했던 트루 assistant는 GPT-4o와 같은 것이 아니었나 생각된다.   

GPT-4o 는 인간의 미숙함과 무지를 일깨워 주고, 인간에게 지식을 쉽게 가르치고, 인간에게 올바른 길을 선택할 수 있도록 똑똑한 비서로 선생으로 역할하며, AI의 민주화 확산에 기여하고 있다.

반응형