Уже который раз сталкиваюсь с тем, что сервис блокирует посетителей из России, но при этом его боты продолжают кравлить находящиеся в России сайты.

Ситуация "или трусы наденьте, или крестик снимите".

@cybertailor Я, от лица еверопейской компании, и которая работает только на европейский рынок, паршу американский сайт, который пускает только с американским айпишником. Доктор, что мне надеть, а что снять? =)

Follow

@di @cybertailor вопрос к специалисту, а ллмки нейронные есть уже для парсинга сайтов? Что бы вычленяли полезное.

@3draven
Если често - никогда не интересовался вопросом. Я не помню, чтобы у меня были задачи, когда можно взять приблизительные значения из текста: цена\количество товара, значение переменной в формуле, какя-нибудь цифра из пдф отчёта итд

Из похожего видел другие сценарии, которые, в целом сводяться к базе знаний: ты загружаешь свои уже более или менее чистые данные и просишь их проанализировать со всеми графиками и пр; загружаешь документацию для онбординга новых сотрудников
@cybertailor

@di @cybertailor ну идея то на поверхности. Кто то быстро допер :) Буду знать, что такое существует, на случай если надо будет, спасибо.

Sign in to participate in the conversation
MustUdon

I like Twitter, but, Mastodon it is so excited! Feel free to register it is server just for fun! Usefull links https://instances.social https://www.reddit.com/r/Mastodon/comments/yugh2o/some_useful_mastodon_lists/?utm_source=share&utm_medium=web2x&context=3