Whisper 사용법 - AI로 음성, 동영상을 텍스트로 받아쓰기 (colab 실습 노트북 포함)

Рет қаралды 5,362

OpenAI의 오픈소스 STT 인공지능 모델인 위스퍼 활용방법을 다룹니다.
음성이나 영상 파일을 바탕으로 받아쓰기를 해서 자막이나 텍스트로 변경하는데 활용할 수 있습니다. 오픈소스로 무료이며 성능은 최고입니다.
저는 유튜브 자막을 만들 때 활용하고 있습니다. 유료 자막을 대체할 만큼 성능이 좋습니다.
- 실습 구글 콜랩 노트북 : colab.research...
- 실습에 활용할 수 있는 음성 파일
짧은 버전 : drive.google.c...
긴 버전 : drive.google.c...

Жүктеу

Пікірлер: 24

@happyv1672
3 күн бұрын
우와 감사합니다. 신기하네요. 좋은 자료 감사합니다👍
@tilnote
4 ай бұрын
동영상 설명 중에 오타가 있었네요. 번역 파라미터는 --task translate 입니다. 이렇게 하면 영어 자막이 생성됩니다.
@JKim-mr6sf
9 сағат бұрын
실행했는데 자막 제공 및 자막 제공 및 광고를 포함하고 있습니다라는 텍스트만 나오는데 무슨 문제일까요?
@tilnote
8 сағат бұрын
꼬였을 때는 다시 생성해 보세요.
@user-uq1ke9nq7l
Ай бұрын
openai whisper api를 사용해서 mp3 를 자막으로 만들어보았는데, 이상하하게 timeline 이 안 맞는 구간이 발생합니다. 혹시 이런 경험이 있으신지요? 네이버 클로버에서는 문제 없이 생성되고, Amazon Transcribe 에서도 문제가 없는데, 유독 whisper 에서만 timeline 과 텍스트 싱크가 안 맞는 구간이 나옵니다.(물론 잘 맞는 구간도 있습니다.) 번역 텍스트는 vtt 로 하였습니다.
@tilnote
Ай бұрын
그러셨군요. 저도 최근까지 위스퍼 너무 잘쓰고 있습니다. 그런데 요즘 가끔 타임라인 싱크가 안맞는 경우가 있더라구요. 저의 경우는 영상에 올려보고 너무 시간이 안맞는 경우 다시 생성하는 방식으로 대처하고 있습니다. OpenAI에서 위스퍼 계속 지원해줬으면 좋겠네요.
@doogy777
Ай бұрын
음성파일 말고 영상 파일 400메가정도 짜리 마운트 했는데 왜 위스퍼눌렀는데 진행이 안되고 느낌표와 빨간색이 뜰까요?
@tilnote
Ай бұрын
이전 과정들을 눌러서 실행했는지 확인해 보시고 특히 파일 경로를 한번 확인해 보세요.
@doogy777
Ай бұрын
@@tilnote 파일 꼭 유튜브경로 거쳐야하나요? 그냥 my drive에 바로 넣었는데
@tilnote
Ай бұрын
@@doogy777 그러면 youtube 경로를 빼시면 될거 같아요. 경로명을 맞게 수정하시면 됩니다.
@doogy777
Ай бұрын
@@tilnote 오 파일유형을 생각해보니 mp4인데 mov로 하고있었네요 감사합니다 근데 그렇게 해서 위스퍼했는데 100프로만 나오고 글이 아무것도 안뜨는데 왜그런걸까요?
@b-jt8di
20 күн бұрын
이건 새파일 변환하려고 할 때마다 전 과정을 다시 돌려야 하는 건가요? 아니면 어디서 부터 수정해서 진행해야 할까요? filepath 부분부터 수정해서 다시 실행했더니 오류가 납니다.ㅠㅠ
@tilnote
20 күн бұрын
세션이 남아있다면 whisper 부분만 다시 돌리면 됩니다. 브라우저를 끄거나 시간이 오래지나면 처음부터 돌리면 됩니다. filepath 부분 잘 수정해주시구요. 안누른거 없나 살펴보세요.
@b-jt8di
20 күн бұрын
@@tilnote 알려주셔서 감사합니다!!
@user-rq7kv3xi8u
Ай бұрын
구독백만번 좋아요이백만번 찍고. ㅋㅋㅋ MP3파일은 스크립트제작안되나요? MP3오디오파일 스크립트제작방법알수없을까요?
@tilnote
Ай бұрын
mp3 오디오 파일도 지원합니다. wav, flac 등 다 지원됩니다.
@user-ow4vt9xq4f
3 ай бұрын
잘되는부분은 잘되는데 갑자기 아예 상관없는 자막이 몇분간 쭉 달리는건 어떤오류인가요?
@tilnote
3 ай бұрын
저는 그럴 때는 다시 생성하고는 해요.
@user-ow4vt9xq4f
3 ай бұрын
@@tilnote 걍 한번씩 맛가는거군요.. 알겠습니다. 잘써볼게요
@oreak-1181
3 ай бұрын
베트남어 잘 안돼는데 . 구독하고 갑니다 . 방법좀 부탁합니다
@tilnote
3 ай бұрын
--language Vietnamese 처럼 input 언어를 베트남어로 지정해 보세요.
@reverse_engineering
3 ай бұрын
코렙은 유료로 사용해야되는건가요?
@tilnote
3 ай бұрын
코랩 무료로도 충분합니다.
@reverse_engineering
3 ай бұрын
감사합니다 구독하고 가요~