OpenAI의 오픈소스 STT 인공지능 모델인 위스퍼 활용방법을 다룹니다.
음성이나 영상 파일을 바탕으로 받아쓰기를 해서 자막이나 텍스트로 변경하는데 활용할 수 있습니다. 오픈소스로 무료이며 성능은 최고입니다.
저는 유튜브 자막을 만들 때 활용하고 있습니다. 유료 자막을 대체할 만큼 성능이 좋습니다.
- 실습 구글 콜랩 노트북 : colab.research...
- 실습에 활용할 수 있는 음성 파일
짧은 버전 : drive.google.c...
긴 버전 : drive.google.c...
Негізгі бет Ғылым және технология Whisper 사용법 - AI로 음성, 동영상을 텍스트로 받아쓰기 (colab 실습 노트북 포함)
Пікірлер: 24