Follow

Порекомендуйте чем можно текст в речь нынче прилично превращать?

@3draven ну если без заморочек, у openai есть апи.
если русский нужен, то силеро хорош.
github.com/snakers4/silero-mod
Наверное он тебе и подойдет

@vsv еще вопрос. Чем краткие содержания текстов на русском и английском делать удобнее? И на каком железе этот пайторч лучше запускать так что бы на это железо не разориться? Хочу таки попробовать, но на домашнем ноуте это все будет мешать.

@3draven
Попробуй использовать BERT, я видел уже тренированные модели для славянских языков. У меня заводилась на лэптопе с 16gb ram. Если тебе надо будет дообучить, то потребуется уже 16gb vram.

Если хочешь попробовать LLM, то понадобится где-то 16gb vram и 16-32gb ram.

@vsv

@di @vsv спасибо, судя по всему начну ковырять на ноуте. Там видно будет.

@3draven
Ещё как вариант, можно использовать text rank алгоритмы - они не трансформируют текст, но неплохо вытаскивают ключевые предложения - часто этго вполне достаточно для понимания сути текста

@vsv

@di
В английском наверное не плохо, но в русском с его морфологией, думаю не очень. Хотя не пробовал, врать не буду.
@3draven

@vsv
я, если честно, никогда с русским не работал и мне всегда казалось, что non-English NLP это какая-то отдельная вселенная, но если верить этому исследованию, то всё должно получится

dialog-21.ru/media/5764/golovi

@3draven

@di
О! Это интересно, почитаю. @3draven

@3draven саммари лучше всего (как и все остальное) делает gpt. Вполне хватит 3,5, но у 4 меньше косяков.
Есть ламы ещё (LLaMA), первая уже устаревшая (она хуже 3,5), вторая где-то на том же уровне, но полноразмерную на одной видюхе не поднимешь, умельцы её поджимают, но очень сильно страдает качество.
Но полно всяких апи (есть и агрегатов, которые проксируют). Они примерно все в одном ценовом сегменте, дороже всех gpt, но она и лучше. Все остальные ей уступают (по моим ощущениям)

@vsv апи дорогие какие то. Tts от опенаи, либо я плохо смотрел, либо 1.5 цента за килобайт текста. Краткое содержание текста не видел сколько стоит. Вот и думаю может локально поднять и неплохая идея.

@3draven как ты килобайты подсчитал? У всех цена за токен и это не всегда одно слово.
Посмотри вот тут, там всякие модели:

vsegpt.ru

@vsv спасибо, я думал это там килобайты, а не тысячи токенов :) Пойду изучать. Если тысячи токенов то вроде ничего.

@3draven а блин, ты про tts.
Если нужен один поток, то на своём железе можно. Даже без видюхи (главное ядер побольше у проца)

@3draven по пайторчу, нужна Nvidia
К ней ставишь cuda.
Всякие остальные карты - может какие-то и заводятся, но это какие-то костыли. Я даже ничего и не читал на этот счёт.
Ну ещё можно взять подержанную теслу.
Но покупать специально – я бы 10 раз подумал прежде чем брать. Железо устаревает быстро и я как-то считал – облако выгоднее, хотя в локальном железе есть свои плюсы. Поиграть в игры можно)

@vsv под облаком ты понимаешь апи готовое или какое то амазон облако с видяхами?

@3draven
Апи – это апи)
Я имею ввиду аренду. Поминутная или на месяц.
Есть и такие, которые дают часть ядер (shared). Причём гарантированно.
Если нужен tts, то он и на проце работает, в общем-то. Со скрипом, конечно, но тем не менее.
Ллмки требовательны, да

@3draven
кстати, вот еще какой-то новый сервис tts, но сам еще не пробовал.
deepgram.com/

@vsv у них tts пока не доступен, только наоборот.

@3draven
Да, действительно. Это моя невнимательность. Попался анонс и подумал, что уже сделали.

@3draven

У меня вот такая приложуха. Я расшифровывала 3-х часовую лекцию.

Голосовой блокнот для iOS, попробуйте его! itunes.apple.com/us/app/id1398

Есть сайт speechpad.ru/?ysclid=lqt6w4dfx

Sign in to participate in the conversation
MustUdon

I like Twitter, but, Mastodon it is so excited! Feel free to register it is server just for fun! Usefull links https://instances.social https://www.reddit.com/r/Mastodon/comments/yugh2o/some_useful_mastodon_lists/?utm_source=share&utm_medium=web2x&context=3