Конторы, которые собирают данные в интернете для обучения ИИ вполне вероятно навсегда опередят тех, кто придет за ними. Потому, что далее интернет будет набит данными, сгенеренными ИИ, которые будут менее качественными.
Рандомная, и не верная, мысль с просторов ютуба. Будто школьнику нужны все данные мира.
@3draven Если я правильно понял твой посыл, то проблема в том, что ИИ «травится» ии-шными же генерациями, если на них обучать.
@3draven нет. впихивание в llm всего подряд устарело уже на пару лет.
сейчас рулит выверенная синтетика, и крупные разработчики нанимают специалистов в разных областях человеческой деятельности, чтобы они отлаживали edge cases в специализированных датасетах