티끌모아 태산

AI 트렌드 본문

AI

AI 트렌드

goldpig 2024. 1. 17. 23:03
728x90

GPT 스토어 오픈

출처 openAI

최근 GPT 스토어가 오픈하면서 많은 사람들의 관심을 받고있다. 그래서 특화된 GPTs를 만들 수 있도록 알려주는 유튭 강의도 많이 올라오고 있다. 어떤 분야의 특화된 GPT를 만드는 것이 즐거움을 주는 요소도 있지만 앞으로 수익화가 가능하다는 것에 주목할 필요가 있다.

출처: openAI

우선, 1분기에 미국에서 먼저 GPT 빌더 수익 프로그램을 시작하고 더 자세한 사항은 추후 공개될 예정이다. 유튜브도 영상을 올리고 조회수에 따라 수익을 버는 형식을 GPT에서도 가능하게 함으로써 많은 사람들의 참여를 유도할 것으로 보인다. 여기서는 사용량에 따라 수익을 받을 것이다. chatGPT 서비스가 출시된지 1년 좀 넘었는데, 세상에 정말 많은 변화를 이끌어왔고 성능과 기능이 많이 업데이트 되었다. 앞으로 생성형 서비스가 세상에 얼마나 더 많은 변화를 이끌어 낼 지 기대된다.

Dubbing for Everyone 

https://dubbingforeveryone.github.io/

 

Dubbing for Everyone: Data-Efficient Visual Dubbing using Neural Rendering Priors

The pipeline of our method. We first apply preprocessing to our dataset to obtain 3D reconstructions, tightly and stably cropped to the face. We next obtain person-generic audio-to-expression and neural rendering models using multiple subjects. Given a new

dubbingforeveryone.github.io

해당 기술은 목소리와 입모양을 더빙해주는 기술이다. 예를들어, 내가 한국어로 발표한 영상에 해당 기술을 적용하면 영어로 변조되어서 나올 뿐만 아니라 입모양까지 영어로 말하는 것처럼 보이도록 해준다. 

https://www.youtube.com/watch?v=mnlWVLLoeiY

출처: 유튜브

해당 영상을 보면 입모양까지 거의 완벽하게 바뀌어서 나오는 것을 확인할 수 있다. 정말 기술력이 많이 좋아졌다...🙊 앞으로는 적은 데이터로도 목소리를 학습시켜 다국어로 바꾸고 원하는 말을 시킬 수 있다

메타, AudioBox

메타에서는 AuioBox라는 서비스를 만들었는데, 프롬프트를 작성해서 원하는 소리를 만들어낼 수 있습니다.

출처: AudioBox

해당 홈페이지에 들어가서 데모를 실행해볼 수 있는데, quality가 굉장히 좋은거 같다. 

비디오 생성 AI 'DragNUMA'

https://www.microsoft.com/en-us/research/project/dragnuwa/

 

DragNUWA - Microsoft Research

DragNUWA is a video generation model that utilizes text, images, and trajectory as three essential control factors to facilitate highly controllable video generation from semantic, spatial, and temporal aspects. Distinct from existing research, DragNUWA en

www.microsoft.com

마이크로소프트에서 움직임까지 조정하는 비디오를 생성해주는 서비스를 개발하였다. 해당 기술은 사진에서 사용자들의 어떻게 움직일 지를 예측해서 사진을 비디오처럼 만들어주는 기술. 해당 기술을 영화 촬영 등에 활용하면 좋을 거 같다.

영상 화질 개선 AI, FMA-NET

https://kaist-viclab.github.io/fmanet-site/

 

FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution an

We present a joint learning scheme of video super-resolution and deblurring, called VSRDB, to restore clean high-resolution (HR) videos from blurry low-resolution (LR) ones. This joint restoration problem has drawn much less attention compared to single re

kaist-viclab.github.io

해당 기술은 영상 화질을 개선하는 서비스다. 실제 데모 영상을 보면 굉장한 같다..! 기존에 영상을 찍을 때 움직이거나 움직이면서 동영상을 찍으면 화질이 흐려지거나 선명하지 않은데 해당 기술을 적용하면 움직이더라도 선명하게 촬영된 영상을 확인할 수 있다. 영화나 드라마를 보면 범죄자가 차를타고 도망가는 모습을 카메라로 찍었을 때 흐릿하거나 잘못이지 않아 확대하는 기술이 요구됐었는데, 이런 부분에 많은 도움을 주지 않을까 생각한다.

알리바바, ReplaceAnything

출처: 알리바바

해당 기술은 원하는 부분만 남겨놓고 다른 부분을 바꾸는 기술이다. 그래서 사진처럼 배경이 맘에 들지 않거나 바꾸고 싶은 경우 원하는 것으로 바꿀 수 있다. 

 

날마다 새로운 기술이 쏟아지고 있는 세상에서 어떻게하면 미래에 경쟁력있는 사람이 될 수 있을까? 앞으로 어떤 더 놀라운 기술이 나올지 기대된다. 하지만 한편으론 나를 비롯한 많은 사람들이 급변하는 세상을 어떻게 받아들이고 도태되지 않기 위해 어떻게 행동해야할 지 걱정할 것이다.

728x90

'AI' 카테고리의 다른 글

AI 기능 탑재한 '갤럭시 S24'  (1) 2024.01.21
온디바이스 AI  (0) 2024.01.20
What is Federated learning  (0) 2023.11.07