본문 바로가기
프로그래밍 및 개발/AI

알리바바 클라우드, 통이 완샹 AI 이미지 생성 모델 공개

by typenine9 2023. 7. 14.
300x250

최신 인공지능(AI) 이미지 생성 모델 통이 완샹 공개

통이 완샹이 그린 이미지
통이 완샹 이미지

알리바바, 통이 완샹 공개

 

 

알리바바 그룹의 디지털 기술과 인공지능(AI) 부문인 알리바바 클라우드는 최신 AI 이미지 생성 모델인 통이 완샹(Tongyi Wanxiang)을 공개했습니다. '완샹'은 중국어로 '수만 장의 이미지'를 의미하며, 통이 완샹은 현재 중국의 기업 고객들을 대상으로 베타 테스트 중입니다.

 

동시에 알리바바 클라우드는 'ModelScope'의 다양한 AI 모델들을 활용하여 언어, 비전, 음성 분야의 복잡하고 전문적인 AI 작업을 지원합니다. 'ModelScopeGPT'는 다목적 프레임워크로 발표되었습니다. 작년 11월, 알리바바 클라우드는 개발자와 연구원들을 위해 통이 기반의 텍스트에서 이미지를 생성하는 모델을 포함한 수백 개의 AI 모델을 제공하는 오픈 소스 'ModelScope-down'을 출시했습니다 ModelScope는 900개 이상의 모델과 100만 명 이상의 활성 사용자를 보유하며, 오늘까지 1600만 개 이상의 모델 다운로드를 기록하고 있습니다.

 

'통이 완샹'은 이미지 생성을 위해 다양한 작업을 원활하게 처리할 수 있습니다. 수묵화, 유화, 중국화, 애니메이션, 스케치, 평면 일러스트, 심지어 3D 만화까지 다양한 스타일의 이미지를 생성할 수 있으며, 중국어나 영어 텍스트 지시문(프롬프트)를 사용합니다. 어떤 이미지든 비슷한 스타일의 새로운 이미지로 변환할 수 있으며, 스타일 전이 기능을 통해 원본 이미지의 콘텐츠를 유지하면서 다른 사진의 시각적 스타일을 적용할 수 있습니다.

 

 

통이완샹이 그린 이미지 2

 

알리바바 클라우드의 지식 구조화, 시각 AI, 자연어 처리(NLP) 등 선도적인 기술을 기반으로 한 통이 완샹은 다국어 자료를 활용하여 학습을 강화합니다. 이를 통해 뛰어난 의미 이해력을 자랑하며 정확하고 문맥에 맞는 이미지를 생성할 수 있습니다.

 

또한, 신호 대 잡음 비율을 기반으로 한 고해상도 확산 과정을 최적화하여 구성 정확도와 디테일의 선명함을 균형있게 조절하면서 깨끗한 배경을 가진 고대비 아름다운 이미지를 생성합니다.

 

통이 완샹은 알리바바 클라우드의 독립 대규모 모델인 'Composer'를 사용하여 개발되었습니다. 이를 통해 공간 배치와 팔레트와 같은 최종 이미지 출력에 대한 보다 효과적인 제어가 가능하며, 이미지 합성의 품질과 창의성을 유지합니다.

 

반응형

 

통이 완샹이 만든 이미지 3

 

ModelScopeGPT는 알리바바 클라우드의 플랫폼에서 대규모 언어 모델(LLM)을 활용할 수 있도록 설계된 프레임워크로, LLM을 컨트롤러로 사용하여 Modelscope 오픈 소스 커뮤니티에서 다양한 주제별 모델들을 연결합니다. ModelScope GPT는 알리바바 클라우드가 제공하는 다양한 AI 기능을 활용합니다. 기업과 개발자들은 Modelscope GPT를 무료로 활용할 수 있으며, 사용자의 요청에 따라 다국어 비디오 생성과 같은 복잡한 AI 작업을 수행하기에 가장 적합한 모델을 사용할 수 있습니다.

 

한편, 알리바바 클라우드는 지난 4월 '통이 치엔원'(Tongyi Qianwen)이라는 LLM을 출시하였으며, 이를 가까운 미래에 알리바바의 다양한 비즈니스에 통합하여 사용자 경험을 향상시킬 계획입니다. 알리바바의 고객과 개발자들은 이 모델을 사용하여 비용 효율적인 방식으로 사용자 정의 AI 기능을 개발할 수도 있습니다. 알리바바 클라우드는 통이 완샹 출시 이후, 금융기술, 전자, 교통, 패션, 유제품 등 다양한 분야의 기업들을 포함해 30만 건 이상의 베타 테스트 요청을 받았다고 밝혔습니다.

 

통이 완샹은 또한 알리바바 클라우드의 지능형 어시스턴트 '통이 틴우'(Tong Yi Ting Wu)에 통합되어, 고도의 정확성과 효율성으로 멀티미디어 콘텐츠를 이해하고 분석하는데 도움을 줍니다. 이 AI 기반 어시스턴트 통이 틴우는 출시 이후 36만 명 이상의 사용자가 이용했습니다.

 

통이 완샹 공개의 이점

 

이번 주제의 이점과 우려점을 대중에게 예를 들어 설명하여 일반인들이 쉽게 이해할 수 있도록 합니다.

통이 완샹과 ModelScopeGPT는 기업과 개발자들에게 많은 혜택을 제공합니다. 예를 들어, 패션 기업이 특정 스타일의 일러스트로 상품 카탈로그를 보강할 수 있습니다. 또는 온라인 교육 플랫폼이 다국어 강의 비디오를 생성하여 국제 학생들에게 접근성을 향상시킬 수 있습니다.

 

통이 완샹 공개의 우려점

 

하지만 이러한 기술들은 일부 우려점도 동반합니다. 예를 들어, 저작권 침해의 가능성이 있으며, 부적절하거나 윤리적인 문제가 발생할 수 있습니다. 또한, AI가 생성한 이미지의 진위성과 신뢰성을 검증하는 것이 어려울 수 있습니다. 이러한 우려점들은 적절한 규제와 윤리적인 사용을 통해 극복될 수 있습니다.

 

전망과 기대

 

전망과 기대에 대해 정리하여 마무리합니다.

앞으로 통이 완샹과 ModelScopeGPT는 계속 발전할 것으로 예상됩니다. 기업과 개발자들은 이들 기술을 활용하여 창의적이고 풍부한 AI 솔루션을 개발할 수 있습니다. 더 나아가 알리바바 클라우드는 더 많은 AI 모델과 기능을 도입하여 사용자 경험을 향상시킬 것으로 기대됩니다. 이러한 기술의 발전은 다양한 산업 분야에서 혁신과 성장을 이끌어낼 것으로 기대됩니다. 그러나 이러한 발전과 함께 적절한 규제와 윤리적인 사용이 필요하며, 이를 통해 AI 기술이 사회적으로 발전에 도움이 되는 방향으로 나아갈 수 있을 것입니다.

 

https://typenine9.tistory.com/230

 

메타의 스레드가 5일만에 1억 구독자 돌파, 사용자 급증에 대한 이익과 우려

메타의 스레드가 5일만에 1억 구독자 돌파, 사용자 급증에 대한 이익과 우려 메타의 스레드가 1억명 구독자 돌파 메타가 새롭게 선보인 스레드가 출시 5일만에 1억 명의 구독자를 기록하며 엄청

typenine9.tistory.com

https://typenine9.tistory.com/229

 

ChatGPT 남북한이 5년 이내 통일할 확률은?

남북한이 5년 이내 통일할 확률은? 남북한이 갈라선 지 벌써 73년 남북한이 갈라선 지 벌써 73년이 되었습니다. 저번 달 25일은 6.25 전쟁이 발발한 지 73년이 된 기념행사가 있었습니다. 횟수로만

typenine9.tistory.com

https://typenine9.tistory.com/232

 

한류 AI 대결, 카카오 브레인·네이버·NC소프트 등 국내 초거대 AI 모델 소개

한류 AI 대결, 카카오 브레인·네이버·NC소프트 등 국내 초거대 AI 모델 소개 국내 초거대 AI 모델 소개 한국어 전문 인공지능(AI) 모델이 등장하면서, 국내 정보통신기술(IT) 기업들이 한류로 유명

typenine9.tistory.com

 

<