Skip to main content
AI 얼굴 추적 기술

완벽한 쇼츠를 위한 스마트 얼굴 추적

AutoShorts는 AI 기반 활성 화자 감지를 사용하여 자동으로 얼굴을 추적하고 동영상을 세로 형식으로 지능적으로 크롭합니다. 화자가 항상 프레임 안에 있습니다.

또는

신용카드 불필요 — 무료 클립 3개 포함

롱폼 동영상에서 바이럴 숏 클립으로

A long-form landscape podcast video ready for AI processing into short clips

AutoShorts가 동영상을 분석하고, 최적의 순간을 감지하고, 화자를 추적하며, 플랫폼 준비 세로형 클립을 자동으로 생성합니다.

크리에이터가 만들고, 크리에이터를 위해

AutoShorts 사용자들이 매일 만들고 있는 클립을 확인해 보세요

Creator clip 1
Creator clip 2
Creator clip 3
Creator clip 4
Creator clip 5
Creator clip 6
Creator clip 7
Creator clip 8
Creator clip 1
Creator clip 2
Creator clip 3
Creator clip 4
Creator clip 5
Creator clip 6
Creator clip 7
Creator clip 8
Creator clip 1
Creator clip 2
Creator clip 3
Creator clip 4
Creator clip 5
Creator clip 6
Creator clip 7
Creator clip 8
Creator clip 1
Creator clip 2
Creator clip 3
Creator clip 4
Creator clip 5
Creator clip 6
Creator clip 7
Creator clip 1
Creator clip 2
Creator clip 3
Creator clip 4
Creator clip 5
Creator clip 6
Creator clip 7
Creator clip 1
Creator clip 2
Creator clip 3
Creator clip 4
Creator clip 5
Creator clip 6
Creator clip 7

AutoShorts 얼굴 추적이 특별한 이유

연구실에서 사용되는 것과 동일한 기술, Columbia ASD 기반

활성 화자 감지

AI가 발화자를 식별하고 얼굴을 추적합니다. 아무 얼굴이 아닌 올바른 얼굴을 추적합니다.

다중 화자 지원

인터뷰, 패널, 다중 게스트 팟캐스트에서도 작동합니다. 항상 활성 음성을 따라갑니다.

부드러운 추적

60프레임 스무딩 윈도우로 지터를 제거하여 전문적인 카메라 움직임을 구현합니다.

지능형 크롭

가로형 동영상을 자동으로 세로 1080x1920 형식으로 변환하며, 화자를 중앙에 유지합니다.

GPU 가속

클라우드 GPU에서 처리가 실행되어 빠른 결과를 제공합니다. 클립이 몇 분 만에 준비됩니다.

플랫폼 최적화

출력이 TikTok, Instagram Reels, YouTube Shorts에 완벽하게 포맷됩니다.

직접 확인해 보세요

AI가 프레임별로 활성 화자를 추적하여 모든 클립에서 완벽하게 중앙에 유지합니다.

AI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centered
화자 감지됨
AI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centered
화자 감지됨
AI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centered
화자 감지됨
AI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centeredAI-generated vertical clip with active speaker centered
화자 감지됨

얼굴 추적 작동 방식

완벽하게 프레이밍된 숏 동영상까지 간단한 3단계

1

동영상 업로드

동영상 파일을 업로드하거나 YouTube URL을 붙여넣기하세요. 최대 90분 길이의 동영상을 지원합니다.

2

AI가 화자 감지

AI가 모든 프레임을 분석하여 얼굴을 감지하고 오디오-비주얼 상관관계를 사용하여 활성 화자를 식별합니다.

3

완벽한 쇼츠 받기

부드러운 얼굴 추적, 애니메이션 자막, 최적화된 프레이밍이 포함된 세로형 클립을 다운로드하세요.

AI-generated vertical short clips ready for social media

9배

수동 편집보다 빠른 속도

40%

자막으로 늘어나는 시청 시간

1080×1920

플랫폼 준비 세로 형식

자주 묻는 질문

AutoShorts 얼굴 추적 기술에 대한 모든 것

AutoShorts는 동영상과 오디오를 모두 분석하여 어떤 얼굴이 말하고 있는지 판별하는 AI 모델인 Columbia ASD(활성 화자 감지)를 사용합니다. 그런 다음 활성 화자를 세로 형식 중앙에 유지하도록 동영상을 부드럽게 크롭합니다.
네! AI가 여러 얼굴을 추적하고 현재 말하고 있는 사람에게 자동으로 초점을 전환합니다. 인터뷰, 팟캐스트, 패널 토론에 완벽합니다.
얼굴이 감지되지 않으면 AutoShorts는 지능형 폴백을 사용합니다: 동영상을 너비에 맞추고 세로 공간을 채우는 블러 배경을 추가합니다.
Columbia ASD는 활성 화자 식별 정확도 95% 이상의 연구 수준 모델입니다. 60프레임 스무딩과 결합하면 전문적인 품질의 추적이 가능합니다.
물론입니다! 팟캐스트는 가장 인기 있는 활용 사례 중 하나입니다. 얼굴 추적은 단독 진행자와 다중 게스트 팟캐스트 형식 모두에서 잘 작동합니다.

오늘 AI 얼굴 추적을 체험해 보세요

첫 동영상을 업로드하고 AI 얼굴 추적이 완벽하게 프레이밍된 세로형 쇼츠를 어떻게 만드는지 확인하세요.

신용카드 불필요 — 무료 클립 3개 포함

더 많은 기능 살펴보기

AutoShorts를 특별하게 만드는 모든 AI 기반 도구를 살펴보세요