과학기술

ChatGPT, 챗GPT란, 챗GPT뜻

열린마음이 2024. 1. 1. 18:18

 

챗 GPT란

요즘 과학계에서 IT가 많은 사람들의 관심을 받고 있습니다. 특히 인공지능(人工智能 또는 AI, artificial intelligence)에 대한 이목이 집중되고 있는데, 최근 오픈AI(OpenAI)에 의해 개발된 챗봇(chatbot)인 챗GPT(ChatGPT)가 그 중 하나입니다.
 
챗 GPT(Chat GPT)는 Chat Generative Pre-trained Transformer의 약자로, 2022년 11월 30일에 출시 되었습니다. 이는 대규모 언어 모델을 기반으로, 사용자로 하여금 대화를 적절한 길이, 형식, 스타일, 세부 수준, 그리고 언어에 맞게 조정하여 사용할 수 있게 합니다. 프롬프트 엔지니어링(prompt engineering)이라고 하는 연속적인 프롬프트와 응답은 각 대화 단계에서 문맥에 맞게 고려되어 반응하도록 설계되었습니다.
 

Chat GPT 사용 화면.

 
 
 

챗 GPT의 시작

챗GPT는 2023년 1월까지 OpenAI는 역사상 가장 빠르게 성장하는 소비자용 소프트웨어 애플리케이션이 되었고, 1억 명 이상의 사용자를 확보하였습니다. 이에 따라 OpenAI의 가치를 290억 달러로 성장하는데 기여했습니다. 
 
챗GPT의 출시는 Bard, Erine Bot, LLaMA, Claude, Grok 등의 경쟁 제품의 개발에 박차를 가했습니다.
 
마이크로소프트(Microsoft)는 OpenAI의 GPT-4를 기반으로 Bing Chat을 출시했습니다. 일부 전문가들은 챗GPT나 유사 프로그램이 인간의 지능을 대체하거나, 위축시켜 표절을 가능하게 하거나 또는 잘못된 정보를 조장할 가능성에 대한 우려를 표했습니다. 
 
챗GPT는 GPT-3.5 또는 GPT-4 둘 중 하나를 기반으로 구축되었습니다. 이 두 모델은 구글(Google)이 개발한 번역기 구조(transformer architecture)를 기반으로 한 OpenAI의 고유한 시리즈에 속하는 모델로서, 챗GPT는 지도 학습(supervised learning)과 강화 학습(reinforcement learning)을 결합하여 대화형 애플리케이션에 맞게 미세 조정되었습니다. 
 
챗GPT는 사용자들이 무료로 이용할 수 있는 리서치 프리뷰, 즉 미리보기 식으로 출시되었지만, 현재는 프리미엄 모델로 서비스를 운영하고 있습니다. 따라서 무료로 이용하는 사용자에게는 GPT-3.5 기반의 버전에 접속할 수 있으며, 보다 정교한 GPT-4 기반 버전은 'Chat GPT Plus'라는 유료 서비스로 이용가능합니다.
 
이러한 챗GPT는 인공지능 분야에서 지속적으로 성장중이며, 현재 가장 화제의 중심이 되면서 AI 열풍을 일으키고 있습니다. 
 
 

챗GPT 훈련

챗GPT는 위에도 말씀드렸듯이 대화 사용을 목적으로 한 GPT-3.5 및 GPT-4라는 특정 GPT 모델을 기초하여 세밀하게 조정되었습니다. 미세 조정 프로세스에서는 RLHF(Reinforcement Learning from Human Feedback)라는 사람의 피드백을 바탕으로 지도학습과 강화학습을 모두 활용했습니다.
 
두 접근법 모두 사람을 트레이너로 삼아 모델 퍼포먼스를 향상시키도록 했습니다. 지도 학습의 경우 트레이너는 사용자와 AI 보조자라는 두 가지 측면을 모두 담당했습니다. 강화 학습 단계에서는 인간트레이너가 이전 대화에서 모델이 생성한 응답의 순위를 매겼습니다. 이러한 순위는 PPO(Proximal Policy Optimization)를 사용하여 여러 반복을 사용하여 모델을 추가로 미세 조정하는 데 사용되는 '보상 모델'을 만드는 것에 사용되었습니다.
 
타임지는 성적 학대, 폭력, 인종차별, 성차별 등과 같은 유해 콘텐츠에 대한 안전 시스템을 구축하기 위해 오픈AI(OpenAI)가 시간당 2달러 미만의 급여를 받는 케냐 아웃소싱 근로자를 고용하여 유해 콘텐츠에 라벨을 붙였다고 밝혔습니다. 이러한 라벨은 향후 이러한 유해 콘텐츠를 감지하기 위한 모델을 교육 및 훈련하는 데 사용되었습니다.
 
한편, 아웃 소싱된 노동자들은 '독성'과 충격적인 콘텐츠에 노출되었고, 이 임무를 수행한 한 노동자는 이 임무에 대해 '고문'과 같다고 묘사하였습니다. OpenAI의 아웃 소싱 파트너는 캘리포니아주 샌프란시스코에 본사를 둔 교육 데이터회사인 Sama였습니다.
 
챗GPT는 처음에는 마이크로소프트가 OpenAI용으로 구축한 프로그램입니다. 챗GPT는 수억 달러의 비용이 드는 것으로 알려진 엔비디아 GPU(Nvidia GPU)로 구동되는 Microsoft Azure 슈퍼컴퓨팅 인프라를 사용하였고, 챗GPT의 성공에 이어 마이크로소프트는 2023년에 OpenAI 인프라를 대폭 업그레이드 했습니다.
 
리버사이드 캘리포니아 대학(University of California, Riverside)의 과학자들은 챗GPT에 대한 일련의 프롬프트를 표시하려면 Microsoft 서버를 냉각하기 위해 약 500밀리리터의 물이 필요하다고 추정했습니다. Trend Force의 시장 정보에 따르면 2023년에 챗GPT를 구동하는 데 30,000개의 Nvidia GPU(각각 약 $10,000~$15,000)가 사용되었을 것으로 추정하고 있습니다. 
 
OpenAI는 챗GPT 사용자로부터 데이터를 수집하여 서비스를 더 교육시키고 세부 조정을 더 수행합니다. 사용자는 챗GPT에서 받은 응답을 찬성으로 올리거나 반대 투표를 하고, 추가 피드백으로 필드를 채울 수 있습니다. 챗GPT의 훈련 데이터에는 소프트웨어 매뉴얼 페이지, 게시판 시스템 등의 인터넷 현상에 대한 정보 및 여러 프로그래밍 언어가 포함되어 있습니다. 위키피디아는 챗GPT 훈련 데이터의 소스 중 하나이기도 합니다.