tldr: автор предлагает вместо обычных разделителей (запятая, табуляция) использовать стандартные разделители текста из ASCII
@di читая это мне захотелось пользоваться только таким форматом
@OfShad0ws @blue @di мы выгружаем миллиарды записей, обычным цсв, да еще и с обработкой на лету. Ничего в нем сложного нет если система источник одна и формат без диалектов. Кажется эта штука болит только у авторов либ, которым надо диалекты. Парсер стабильного диалекта в виде КА прост.
@blue @OfShad0ws @di трудно сказать, внутри своей системы можно думать, имея дело с внешней, что есть то есть, а так, можно например parquet посмотреть вместо текстового формата и в зависимости от условий может оказаться, что любой цсв говно. От проекта зависит.