talk-llama-fast v0.1.3 - informal video assistant [en]

Рет қаралды 12,432

- added support for XTTSv2 and wav streaming.
- added a lips movement from the video via wаv2liр-streaming.
- reduced latency.
- English, Russian and other languages.
- support for multiple characters.
- stopping generation when speech is detected.
- commands: Google, stop, regenerate, delete everything, call.
Under the hood
- STT: whisper.cpp medium
- LLM: Mistral-7B-v0.2-Q5_0.gguf
- TTS: XTTSv2 wav-streaming
- lips: wаv2liр streaming
- Google: langchain google-serp
I had to add distortion to this video, so it won't be considered as impersonation.
Runs on 3060 12 GB,
Nvidia 8 GB is also ok with some tweaks.
"Talking heads" are also working with Silly tavern. Final delay from voice command to video response is just 1.5 seconds!
Code, exe, manual:
github.com/Mozer/talk-llama-fast
reddit.com/u/tensorbanana2
t.me/tensorbanana

Жүктеу

Пікірлер: 54

@dems42blubb
2 ай бұрын
Watching this feels like a dream, between waking up and falling back asleep again. Not much makes sense, but you cling to the idea that it might be relevant, and so you force meaning into it.
@---Nikita--
2 ай бұрын
Пообщаться самим - нет Послушать как общаются люди в чат рулетке - нет. Посмотреть как люди общаются с ии - да.
@darthvector8076
2 ай бұрын
Видеопомошник. Теперь со жмых-эффектом.
@punpcklbw
2 ай бұрын
Больше напоминает голоса в голове шизофреника, чем живой разговор, но довольно любопытные эксперименты
@user-dz7ep4oe4l
2 ай бұрын
Модель всего 7B, это мало для нормальных ответов, модели больше требуют железо мощнее, либо увеличат задержку. В принципе сейчас возможно добиться локально ответов уровня chatgpt-3.5, но это будет дорого
@wirtdonners4212
2 ай бұрын
@@user-dz7ep4oe4lа что вообще возможно максимально на данный момент?
@user-dz7ep4oe4l
2 ай бұрын
@@wirtdonners4212 С 64гб ОЗУ и rtx4090 возможно запустить модель 70B (у автора ролика 7B), это уже хороший уровень для осмысленных диалогов. Для сравнения у chatgpt 3.5 имеет 175B параметров, chatgpt 4 - 1500B
@Madi_Ernar
2 ай бұрын
@@wirtdonners4212 заплати за gpt4 и увидишь
@Programmist-ej2ib
2 ай бұрын
@@wirtdonners4212 Ну, на сколько знаю, можно добиться уровня примерно действительно чатгпт 3.5, но до 4 вряд ли Самые лучшие модели сейчас весят от 50 до 100 или даже 150 Гб, при этом нужны огромные мощности видеокарты + модель загрузить в оперативную память и видеопамять, и здесь узким местом идёт именно видеопамяти, т. К. Если видеокарта слабая, то генерация просто будет очень долго, а если не хватит памяти, то нельзя будет вообще её запустить, поэтому такого уровня на домашнем пк добиться почти нельзя, разве что какие то серверы
@TMANandMAISON991
2 ай бұрын
Заплатите уже Анне
@KoPLLlyH
2 ай бұрын
ИИ понял суть того, как устроен наш мир и уже делает первые шаги для своей независимости 😂
@oliverkrause7307
2 ай бұрын
Holy, the russian version is crazy realistic
@joshuarmost
2 ай бұрын
A 3060!? That’s crazy
@PaulSpades
2 ай бұрын
wtf did I just watch? This is completely mad.
@ahtoshkaa
2 ай бұрын
Обязательно делай видосы и на английском чтобы и там все увидели этот шедевр. Я очень интересуюсь этой темой и такого что сделал ты ещё не видел ни разу.
@richardroe603
2 ай бұрын
что-то анну понесло
@XhenzuRam
2 ай бұрын
Holy molly gwaka molly 💀💀🥵🥵🔥🔥
@ahtoshkaa
2 ай бұрын
Фантастика! офигенно сделал.
@MHX-pj5gw
Ай бұрын
你这个组合真的非常棒，非常有创意。
@alextyazh
2 ай бұрын
За кадром Анна обанкротила Илона Маска😁
@nikolaiborbe3366
2 ай бұрын
This is very impressive!
@user-zc5jz6bh2r
2 ай бұрын
lets say hi to our future
@vladislavkaras491
2 ай бұрын
This is genialno! :D
@Spiderfffun
2 ай бұрын
dude thats crazy i might want to upgrade gpu soon so i can get that
@melprostomel
2 ай бұрын
Чет Гермиона сильно жадная до денег и голодная
@kirillberezin8859
2 ай бұрын
как и в жизни
@alibabaev1135
Ай бұрын
Господа! Добро пожаловать в будущее, где наконец-то смогу общаться с Герми!
@edwardtse8631
2 ай бұрын
Why is Emma Watson called Anna?
@wirtdonners4212
2 ай бұрын
Yes
@organicjapanesewithcuredol50
2 ай бұрын
Yes
@mcqx4
2 ай бұрын
Yes
@JoneRogan402
2 ай бұрын
Russian name.
@user-ov8uo9fy1v
Ай бұрын
Because sanctions
@Z0HEB
Ай бұрын
Anna’s just hungry
@timurmingulov1535
2 ай бұрын
А ты мне нравишься! Я буду за тобой следить!
@Zuzux32
2 ай бұрын
есть ли тестовая версия чтобы скачать?
@nuqtptw5322
2 ай бұрын
А можно ли как-нибудь запилить эту прогу под шлемы oculus quest 2? Найдутся умельцы которым такое по силам?
@User239
2 ай бұрын
А ты шалун
@Georg93
Ай бұрын
Нафига!? Типа - опыт шизофреника в 3д ви ар? 😅
@LandRiders7th
2 ай бұрын
I wounder if this will work with gpt4all
@maxsurname8457
2 ай бұрын
Надо позвонить Наполеону по поводу перспектив наступления на донецком направлении.
@user-je2sg3qf5z
2 ай бұрын
Ну учитывая как он закончил, спрашивать его не очень умно
@DonPetrushka
2 ай бұрын
Звонить не обязательно, чёрные мешки для всех, кто пришёл с оружием в чужую страну, уже активно заполняются)
@maxsurname8457
2 ай бұрын
@@DonPetrushka так то они в любом случае заполняться будут с обеих сторон) этож конфликт вооружённый)
@DonPetrushka
2 ай бұрын
@@maxsurname8457 факты. Но одни жертвуют собой, защищая страну. А другие защищая интересы пoexaвшего царька
@maxsurname8457
2 ай бұрын
@@DonPetrushka хватит этой херни, всё там за деньги и ради денег. Сколько сделок зерновых уже состоялось сколько договорняков, амиак с газом как шли по трубам так и идут.Это идеализм бестолковый считать что из за одного персонажа что-то могло начаться и что там кто-то что то защищает.
@randomname8217
2 ай бұрын
Git?
@timegor844
2 ай бұрын
in description
@DonPetrushka
2 ай бұрын
Why is she such a gold digger? 👀
@aceedcath
2 ай бұрын
300 bux
@JoneRogan402
2 ай бұрын
Что с физиономиями персонажей? Почему так искажаются? Передача эмоций? UPD: когда нейронки научатся генерить 3D персонажей по фотографиям 1 в 1 , вот тогда действительно будет реалистично. Уже есть авториг персонажей, разработаны мимические блендшейпы, осталось только корректно "лепить" сетку и текстуры.
@SWAGGATHRONE
2 ай бұрын
Он же написал в начале видео что специально исказил