안녕하세요.
열린 마음이입니다.
요즘 생성형 인공지능(Generative AI)에 관해 많이 들어보기도 하며, 실제로도 업무나 일상생활 등에서 사용하기도 합니다.
그런데 생성형 인공지능(이하, 생성형 AI)으로 만들어진 이미지의 경우에 실제와 분간할 수 없을 정도로 잘 만들어지고 있는데요. 그래서 생성형 AI로 만든 이미지나 영상을 실제 이미지나 영상과 비교하기 어렵다는 문제가 발생합니다.
일부 걱정이 앞선다고 생각하실 수도 있으나, 실제로 영향력 있는 인물이나 사회, 정치 등 민감한 이슈들에 대해 생성형 AI를 이용하여 가짜 뉴스가 생성된다면 한 국가 내에서 뿐만 아니라 전 세계적으로도 위험한 일이 발생할 수도 있을 것입니다.
그래서 오늘은 생성형 AI에 의해 만들어진 이미지나 영상을 구분할 수 있는 방법인 AI 워터마크에 대해 알아보도록 하겠습니다.
그럼 AI 워터마크를 알아보기 전에 생성형 AI모델인 챗GPT(ChatGPT)와 제미나이(Gemini)에 관해 이전에 정리한 포스팅이 있으니 관련해서 궁금하시다면 읽어보면 도움이 될 것입니다.
(1편 링크입니다: https://open-mind-the-rich.tistory.com/entry/ChatGPT-%EC%B1%97GPT%EB%9E%80-%EC%B1%97GPT%EB%9C%BB)
ChatGPT, 챗GPT란, 챗GPT뜻
안녕하세요. 열린마음이 입니다. 요즘 인공지능에 관한 관심이 뜨거운 가운데, 오픈AI라는 기업에서 챗GPT를 선보였습니다.따라서 챗GPT(Chat GPT)란 무엇인지, 챗GPT가 어떻게 시작되고 훈련되어 기
open-mind-the-rich.tistory.com
구글의 생성형AI Gemini란, 제미나이란, 제미니란, 챗GPT의 대항마가 될 수 있을까?
안녕하세요. 열린마음이 입니다. 지난 시간에 오픈AI에서 선보인 챗GPT에 관해 알아보았는데요.(1편 링크입니다: https://open-mind-the-rich.tistory.com/entry/ChatGPT-%EC%B1%97GPT%EB%9E%80-%EC%B1%97GPT%EB%9C%BB) ChatGPT,
open-mind-the-rich.tistory.com
프롬프트 엔지니어(Prompt Engineer)란, AI 시대의 미래 유망 직업으로 떠오르는 프롬프트 엔지니어!
안녕하세요.열린마음이 입니다. 요즘 인공지능이 우리의 미래 산업이라는 관점과 함께 미래 유망 직종으로 프롬프릍 엔지니어가 떠오르고 있습니다.그래서 프롬프트 엔지니어가 무엇인지, 어
open-mind-the-rich.tistory.com
생성형 AI의 시작
생성형 AI는 2020년대에 들어서 대규모 언어 모델(LLM) 기반의 딥 신경망 개선을 통해 보편화되었는데요. 주요 생성형 AI도구의 종류로는 챗봇, 텍스트-이미지모델, 텍스트-비디오모델 등이 있습니다.
각 종류에 해당하는 세부 생성형 AI 도구는 다음과 같습니다.
1) 챗봇: 챗gpt, 제미나이 뿐만 아니라 Copilot, Claude, Grok, DeepSeek 등
2) 텍스트-이미지 모델: Stable Diffusion, Midjourney, DALL-E 등
3) 텍스트 비디오 모델: Veo, Sora 등
생성형 AI로 인한 발생 가능한 문제점
생성형 AI로 인해 제기되는 문제점으로 여러 윤리적인 문제와 더불어 인간의 일자리 대체 가능성, 지적 재산권 침해 등으로 꼽을 수 있습니다. 왜냐하면 생성형 AI는 다양한 산업분야에서 응용이 가능한데, 소프트웨어 개발, 의료, 금융, 엔터테인먼트, 고객 서비스, 영업, 마케팅, 예술, 글쓰기, 패션, 제품 디자인 등이 포함됩니다.
따라서, 이를 이용한 사이버 범죄로의 사용 가능성 및 가짜 뉴스나 딥페이크를 통해 앞으로 일어날 수 있는 여러 문제점들이 제기되고 있는 상황입니다.
생성형 AI가 제작한 디지털 콘텐츠는 실제로 유명인의 목소리와 이미지, 나아가 영상까지 거의 구별하기 어렵게, 치밀하게 발전하고 있는 상황입니다. 따라서, 이를 감별하기 위한 잠재적인 완화 전략에 관심이 쏠리고 있습니다. 생성형 AI 콘텐츠를 구별하기 위한 방법으로 디지털 워터마크(digital watermark), 콘텐츠 인증(content authentication), 정보 검색 (information retrieval) 및 머신 러닝 분류기 모델(machine learning classifier models) 등을 제시하고 있습니다.
디지털 워터마크란
디지컬 워터마크는 디지털 서명이라고도 하며, 일반적으로 이미지나 오디오, 비디오 등의 노이즈 허용 신호에 은밀하게 삽입되어 저작권 소유권을 식별하는 데 사용되는 일종의 마커입니다. 일반적으로, 저작권 침해 추적이나 지폐 인증 등에 주로 이용되고 있지만, 지금은 생성형 AI 콘텐츠에도 식별할 수 있도록 해야 한다는 우려의 목소리도 있는 상황입니다.
디지털 워터마크는 기존의 물리적 워터마크처럼 특정 조건에서만 인식 가능한 경우가 많습니다. 일반적으로 기존 워터 마크는 이미지 또는 비디오와 같은 가시적 매체에 적용 가능한 반면, 디지털워터 마크는 오디오, 사진, 비디오, 텍스트, 3D 모델 등에 적용 가능 합니다.
디지털 워터마크에 사용할 수 있는 필수적인 속성은 사용 예시에 따라 달라지는데요.
디지털 워터마크는 정보를 전달하기 위해 사용되는 고주파 신호인 반송파 신호에 디지털 정보를 숨기는 프로세스입니다. 미디어 파일에 저작권 정보를 표시하는 경우, 디지털 워터마크는 반송파 신호에 적용될 수 있는 변화에 대해 상당히 강해야 합니다. 하지만,반송파 신호의 무결성을 보장해야 하는 경우, 반송파 신호가 전송 과정에서 왜곡, 손상이나 변형 없이 원래의 정보를 정확하게 유지하도록 해야 하기 때문에 취약한 워터마크가 적용되게 됩니다.
디지털 워터마크의 종류
디지털 워터마크는 디지털 콘텐츠에 보이게하여 인지 가능한 워터마크이거나, 또는 보이지 않게 하여 인지 불가능한 워터마크로 분류할 수 있습니다.
인지가능한 워터마크의 경우, 시각적으로 명확하게 보이기 때문에 사용자가 쉽게 생성형 AI로 인해 만들어진 콘텐츠임을 확인할 수 있습니다. 예를 들자면, 삼성 갤럭시 AI, SK텔레콤 에이닷, 어도비 파이어플라이 등은 이미지 하단부에 로고 또는 AI 생성이라는 문구를 삽입하여 인지가능한 워터마크 표현합니다.
반면, 인지 불가능한 워터마크의 경우, 투명한 워터마크로서 육안으로는 보이지 않기 때문에 특정 소프트웨어나 프로그램, 알고리즘을 통해서만 확인 가능합니다. 예를 들어, 구글 딥마인드의 SynthID, 어도비-구글-오픈AI-마이크로소프트 등 주요 기업에서 함께 참여하는 C2PA 표준화, 오픈 AI의 DALL-E3의 워터마크 등이 인지 불가능한 워터마크에 포함됩니다.
특히, C2PA (Contents Authenticity Initiative) 표준화는 주요 기업들이 참여하여 만들었으며, 워터마크와 메타데이터를 결합하여 디지털 콘텐츠의 진위와 출처를 검증하는 국제 표준입니다. SynthID는 인지불가능한 워터마크로 이미지, 오디오 및 동영상 등 다양한 콘텐츠에 적용되어 특정 AI 도구로 생성된 것임을 추적할 수 있습니다.
디지털 워터마크의 필수 기술적 특징
디지털 워터마크의 경우, 여러가지 기술적 특징이 있는데요. 그중 5가지 항목에 대해 알아보려고 합니다.
1) 은닉성: 디지털 워터마크가 디지털 콘텐츠에 숨겨져 있으면서도, 디지털 콘텐츠의 품질에는 영향을 주지 않아야 합니다.
2) 견고성: 사이즈 변형, 사이즈 크롭, 노이즈 추가 등의 변화에도 디지털 워터마크는 유지되어야 합니다.
3) 정확성 또는 취약성: 디지털 워터마크 자체로서 위조가 어려워야 하며, 콘텐츠가 변경된 경우 이를 감지할 수 있어야 합니다.
4) 크로스모달 지원: 다양한 매체의 디지털 콘텐츠(예: 이미지, 영상, 오디오, 텍스트 등)에 적용 가능해야 합니다.
5) 메타데이터 연동: 디지털 워터마크와 함께 사용되는 C2PA 등 표준은 생성 시점, 생성 도구, 인증 정보 등 메타데이터를 포함해 추적성을 높여야 합니다.
생성형 AI 콘텐츠 구별 방법 및 도구
생성형 AI를 감지할 수 있는 디지털 콘텐츠 자체의 특성으로는 이미지의 경우, 손가락의 개수나 신체 비율, 피부 질감, 배경 왜곡 등의 비정상적인 패턴으로 탐지 가능합니다. 또한 영상의 경우, 그림자 및 움직임, 얼굴 미세 왜곡, 눈동자 반사 등을 통해 알 수 있으며, 오디오의 경우, 억양, 톤, 발음, 속도 내용의 신뢰성 등이 있습니다. 마지막으로 텍스트의 경우, 문체 변화, 반복, 맥락 부족, 논리적 비약 등으로 AI를 통해 얻어진 디지털 콘텐츠임을 알 수 있습니다.
그렇다면 직접 눈으로 보는 위의 감별법과 별개로, 생성형 AI를 감지할 수 있는 도구로는 현재 여러 가지가 있으며 이미지, 텍스트, 오디오 및 동영상과 같은 매체 종류에 따라 구분가능합니다. 이미지의 경우, Sight Engine, Deepware 등이 있으며, 텍스트는 Grammarly AI 감지, GPTZero, isgen.ai 등이 있습니다. 또한 오디오의 경우, ElevenLabs 등과 동영상의 경우, Deepware 등이 있습니다.
그러나, 현재의 디지털 워터마크는 여러 방면에서 보완이 필요한 상황인데요. 인지 가능한 워터마크는 크롭 등으로 쉽게 제거가 가능한 상황이며, 인지 불가능한 워터마크 또한 최근에는 제거 기술이 발전하면서 완벽한 해결책은 아닙니다. 따라서, 디지털 워터마크가 없는 생성형 AI의 결과물은 별도의 탐지 기술이 요구되고 있으며, 관련 분야에서는 계속적인 개발 과정에 있습니다.
오늘은 생성형 AI에서 만들어진 디지털 콘텐츠를 구별해 낼 수 있는 방법과 도구들에 대해 알아보았는데요. 디지털 워터마크는 저작권 표시와 추적성 확보에 효과적이지만, 완벽한 해결책은 아니므로 생성형 AI 콘텐츠의 식별을 위한 워터마크, 탐지 도구 등 다양한 방법을 결합하여 식별에 정확성을 높이는 방법을 고안해 내는 것이 앞으로 주요한 과제가 될 것으로 생각합니다.
또한 이 시대를 살아가는 지금 세대와 후손 세대를 위한 생성형 AI 콘텐츠를 구별할 수 있는 AI 탐지기와 보안 교육 또한 필요할 것으로 생각됩니다.
다음에도 재미있는 내용으로 찾아뵙겠습니다.
감사합니다.^^
'최신 과학기술 > 인공지능 및 소프트웨어' 카테고리의 다른 글
양자기술 & 첨단 컴퓨팅, 미래를 여는 신비로운 힘! (부제: 양자컴퓨터란, 양자컴퓨팅 뜻, 양자컴퓨팅 원리, 양자컴퓨팅 활용분야, 양자인공지능, 양자AI, 하이브리드 컴퓨팅, 양자통신, 양자센서, 양자센싱) (7) | 2025.07.17 |
---|---|
프롬프트 엔지니어(Prompt Engineer)란, AI 시대의 미래 유망 직업으로 떠오르는 프롬프트 엔지니어! (0) | 2024.01.07 |
구글의 생성형AI Gemini란, 제미나이란, 제미니란, 챗GPT의 대항마가 될 수 있을까? (2) | 2024.01.05 |
ChatGPT, 챗GPT란, 챗GPT뜻 (2) | 2024.01.01 |