프롬프트 엔지니어(Prompt Engineer)란
프롬프트 엔지니어(Prompt Engineer)는 챗GPT가 새로운 AI시대를 열고 있는 지금, 그리고 가까운 미래에 새로이 급부상하는 직업으로 언급되고 있습니다. 생성형 AI는 인간을 모방하고자 하지만, 최적의 결과물을 만들기 위해서는 대규모 언어 모델(Large Language Model, LLM)에서 그에 맞는 자세한 프롬프트를 필요로 합니다. 따라서 이러한 프롬프트를 구조화하기 위한 ‘프롬프트 엔지니어링(Prompt Engineering)’은 챗GPT와 같은 생성형 AI 모델이 쉽게 이해하고 해석할 수 있도록 텍스트를 구조화함으로써 원하는 결과를 생성하는 프로세스를 말합니다.
프롬프트의 역사
2021년에 연구원들은 하나의 사전 훈련된 모델(T0)을 미세 조정하였고, 이때 새로운 작업에서 양호한 성능을 보인 12개의 자연어 처리 작업 (Natural Language Processing, NLP)을 수행하였습니다. 12개의 자연어 처리 작업은 62개의 데이터세트를 이용하였고, 하나의 자연어 처리작업에 여러 데이터 세트가 포함되었습니다. 연구원들이 미세 조정한 모델(T0)은 하나의 작업만 수행하도록 직접 훈련된 모델을 능가합니다.
새로운 작업이 주어졌을 때, 작업을 해결하기 위해 T0 모델에는 구조화된 프롬프트로 작업이 제공됩니다.
다음과 같은 프롬프트가 T0 모델이 작업을 해결하기 위해 사용됩니다.
(예시) IF {{premise}} is true, is it also true that {{hypothesis}}? ||| {entailed}}.
프롬프트 저장소에 따르면, 2022년 2월에 약 170건의 데이터 세트에 대해 2,000개 이상의 공용 프롬프트가 이용 가능했다고 보고되었습니다. 또한 같은 해, 구글의 연구원들은 ‘연속적 사고(chain-of-thought)’ 프롬프트 기술을 제안하였습니다.
이듬해 2023년에는 여러 텍스트-텍스트(Text-to-Text)와 텍스트-이미지(Text-to-Image) 프롬프트 데이터베이스가 공개되기도 했습니다.
프롬프트(Prompt)의 종류
프롬프트(Prompt)는 AI가 수행해야 하는 작업을 설명하는 자연어 텍스트로, 텍스트-텍스트 모델(text-to-text model), 텍스트-이미지 모델(text-to-image model), 텍스트-오디오 모델(text-to-audio model) 등으로 프롬프트 작업이 이루어집니다.
텍스트 간 모델/ 텍스트-텍스트 모델 (Text-to-Text model)
텍스트-텍스트 모델의 프롬프트에는 질문, 명령어, 피드백에 대한 짧은 설명, 문맥(context), 지침(instructions), 입력 자료(input data)가 포함된 긴 설명 등을 포함합니다.
- 질문: (예시) ‘페르마의 작은 정리란 무엇인가?’
- 명령어: (예시) ‘떨어지는 낙엽에 대해 시를 쓰세요’
- 피드백에 대한 짧은 설명: (예시) “너무 장황해요”, “너무 형식적이에요”, “다른 말로 표현해주세요”, “이 단어는 생략해주세요”
또한 ‘프랑스어 원어민처럼 행동하기’와 같은 역할을 AI에게 할당하는 작업이 포함될 수 있으며, few-shot learning 접근방식으로 학습이 가능합니다. 여기에서 말하는 few-shot leaning 접근방식이란 간단한 단어를 각국의 언어로 인공지능이 학습하는 것입니다.; (프랑스어, 이하 ‘프’) -> (영어, 이하 ‘영’)
- (프) maison -> (영) house
- (프) chat -> (영) cat
- (프) chien -> (영) dog
텍스트-이미지 및 텍스트-오디오 모델 (Text-to-Image or Text-to-Audio model)
텍스트-이미지 또는 텍스트-오디오 모델의 경우, 전형적인 프롬프트는 ‘우주인이 말을 타고 있는 고품질 사진’ 또는 ‘오가닉 샘플을 사용한 Lo-fi 느린 BPM 일레트로닉 chill’ 등의 원하는 출력물에 대한 설명을 해야합니다.
또한 텍스트-이미지 모델에서 고품질의 결과물을 유도하려면 원하는 주제, 스타일, 레이아웃, 조명, 심미성을 달성하기 위해 단어를 추가하거나 삭제, 강조, 재순서화 등을 포함하는 작업이 필요합니다.
문맥/상황(context)을 통한 학습
프롬프트 엔지니어링을 가능하게 하는 것은 문맥(context)이라고 불리는 상황 내 학습을 통해서입니다. 상황 내 학습은 프롬프트로부터 일시적으로 학습하는 인공지능 모델의 능력으로 정의되며, 대규모 언어 모델(Large Language Model, LLM)에서 발생하게 됩니다.
이러한 상황을 통한 학습 능력은 모델의 규모에서 출현하는 새로운 속성으로, 다운스트림 스케일링 법칙(downstream scaling laws)의 중단이 발생함으로써 소규모 언어 모델 보다 대규모 언어 모델에서 그 효율성이 다른 속도로 증가합니다.
각 특정 작업에 대한 훈련 및 미세 조정과는 달리, 문맥을 통한 학습은 일시적인 것입니다.
따라서, 사전 훈련 데이터 세트에 이미 존재하는 것을 제외하면, 한 대화에서 다른 대화로의 일시적인 문맥이나 편견(bias)은 전달하지 않습니다.
'과학기술' 카테고리의 다른 글
CES 2024란, CES뜻 (0) | 2024.01.11 |
---|---|
유전자가위란, 크리스퍼 유전자 가위로 유전자편집이 가능한 시대가 왔다. (0) | 2024.01.08 |
구글의 생성형AI Gemini란, 제미나이란, 제미니란, 챗GPT의 대항마가 될 수 있을까? (2) | 2024.01.05 |
ChatGPT, 챗GPT란, 챗GPT뜻 (2) | 2024.01.01 |
분자진단기술을 이용한 질병위험관리, 그리고 암 진단 및 암 관리 (0) | 2023.12.13 |