본문 바로가기
컴퓨터 기술 및 유지보수/ChatGPT

ChatGPT | AI가 작성한 글인지 판별하는 사이트 'AI Text Classifier'

by typenine9 2023. 4. 1.
300x250

 

ChatGPT를 사용하면서 문득 이런 생각이 들었다. 시험이나 문서 작성할 때 ChatGPT 사용해서 하면 그 글은 사람이 쓴 건가 AI가 쓴건가. 이런 생각이 들게 만들 정도로 글을 정교하게 쓰는 기술이 나와버렸으니 글의 판별하기가 더 까다로워 지지 않나 싶다. 그런 와중에 ChatGPT를 찾아보면서 이 사이트를 발견하게 됐다. 

 

https://platform.openai.com/ai-text-classifier%EF%BB%BF

 

OpenAI API

An API for accessing new AI models developed by OpenAI

platform.openai.com

 

바로 AI가 쓴 글인지 판별하는 'ai-text-classifier'  사이트다. 

ChatGPT를 개발한 OpenAI가 만들어낸 서비스로 글을 분석하여 AI가 작성한 글인지 판별할 수 있는 기능을 제공한다.

 

 

링크에 접속하면 위와 같은 메인 페이지가 나온다.

 

위의 화면에서 볼 수 있듯 AI Text Classifier에 관한 설명이 나와있다. 해석하면 다음과 같다.

 


 AI Text Classifier

AI 텍스트 분류기는 ChatGPT와 같은 다양한 소스에서 AI에 의해 텍스트가 생성되었을 가능성을 예측하는 미세 조정 GPT 모델입니다.

이 분류기는 AI 리터러시에 대한 논의를 촉발하는 무료 도구로 사용할 수 있습니다. 교육 환경에서 ChatGPT의 기능, 제한 사항 및 고려 사항에 대한 자세한 내용은 당사 설명서를 참조하십시오.

 

Current limitations:

● 최소 1,000자(약 150~250자)가 필요합니다.
분류기가 항상 정확한 것은 아닙니다. 인공지능이 생성한 텍스트와 사람이 작성한 텍스트 모두에 잘못된 레이블을 붙일 수 있습니다.
AI가 생성한 텍스트는 분류기를 피하기 위해 쉽게 편집할 수 있습니다.
그 분류기는 주로 어른들에 의해 쓰여진 영어 내용에 대해 훈련되었기 때문에 아이들에 의해 쓰여진 텍스트와 영어가 아닌 텍스트에서 틀릴 가능성이 있습니다.

 

Try the classifier

시작하려면 아래 예제를 선택하거나 확인할 텍스트를 붙여넣으십시오. 붙여넣는 텍스트에 대한 적절한 권한이 있는지 확인합니다.


위 글을 보면 알 수 있듯이 최소 1000자 이상을 적어야 판독이 가능하다. 

화면을 더 내리면 텍스트 입력할 수 있는 화면이 나온다. 

 

 

 

Examples를 보면 

Human-Written, AI-Generated, Miscalssified Human-Written 세 개의 버튼이 있다.

눌러보면 각각 사람이 쓴 글, AI가 쓴 글, 사람이 썼는데 AI가 쓴 글로 인식하는 경우에 대한 예시 글을 제공한다.

 

Human-Written

 

Submit 버튼을 눌러 확인해보니

 

 

The classifier considers the text to be very unlikely AI-generated.

분류기는 텍스트가 인공지능에 의해 생성될 가능성이 매우 낮다고 간주합니다.

라고 인식한다.

 

 

AI-Generated

 

Submit 버튼을 눌러 확인해보니

 

The classifier considers the text to be possibly AI-generated.

분류기는 텍스트를 인공지능이 생성한 것으로 간주합니다.

라고 인식한다.

 

 

Miscalssified Human-Written

 

Submit 버튼을 눌러보니

 

 

The classifier considers the text to be likely AI-generated.

분류기는 텍스트가 인공지능에 의해 생성될 가능성이 높다고 간주합니다.

라고 인식한다.

 

챗봇이 발달하니까 이런 서비스들이 생겨나기 시작했다. 얼마나 여파가 컸으면 AI 글을 잡아내려고 할까.

위의 예시글 이후에도 다른 문장으로 해봤는데 솔직히 다 맞진 않았다. 열에 일곱 정도 맞았던 것 같다. 관련 글들 확인해보니 정확도가 그리 좋은 편은 아니라는 글들이 여러 보였다. 직접 해보니 그런것 같다. 아직 정확도가 좋진 않다. 하지만 시간이 지날수록 더 정교하게 구별하지 않을까.

<