#NeuralNetwork #TextGeneration #FAIL #вордли
Хм… Есть задача:
Напиши список слов, удовлетворяющих следующим критериям:
Это должны быть имена существительные;
Это должны быть реально > - существующие слова в русском языке;
Слова должны состоять из 5 букв;
Слова дожны содержать 4 неповторяющихся буквы из списка “У, Я, Ы, Г, З, Б, Ч, Й, Ж, Ш, Ю, Ц, Щ, Э, Ф, Х, Ъ” и 1 букву из списка “О, Е, А, И, Н, Т, С, Р, В, Л, К, М, Д, П”.
Ни одна из протестированных «нейросетей» нишмагла. Причем фейлы сразу по всем критериям, и количеству букв в слове, и повторяемости. Причем, та же #Клавдия даже поясняет, дескать, «Все эти слова являются именами существительными, состоят из 5 букв и содержат 4 буквы из указанного списка трудных” букв и 1 букву из списка более распространенных, при том, что выше написала список полной фигни…
Ни одна нейросетка не родила, например, слов
ГУАШЬ
ГЛУШЬ
ЗУБЕЦ
…это из тех, что я «увидел» самостоятельно.
Не готовы для десктопа © в общем.
@johan при том, что простой ленивый перебор пермутаций с последующим фильтром по словарю на любом языке программирования — мало-мальски способный разработчик напишет на собеседовании с завязанными глазами, пока ему будут параллелльно делать минет, за три минуты.
@johan @mudasobwa мы не ищем легких путей! :)
@mudasobwa @3draven В смысле «не поместиться в память»? Там несколько тысяч слов, кмк, не наберется.
словарь сам может не поместиться
Как же тогда бедные несчастные верстальщики орфографические словари издают 🤣
@mudasobwa @3draven Не сталкивался, но охотно верю. Лиситься, правда, больше 6 не видел, чтобы жрала.
@mudasobwa @3draven Код вордли выполняется на сервере, и он вообще тут не при чём.
@johan выборка из словаря может не поместиться в память, программиста за полную выборку надо сразу в шею гнать
@3draven