Apache Паркет является "столбчатых" формат данных для хранения, который был специально создан для Apache Hadoop семейство проектов.
Паркет рекомендуется использовать с большими данными, в основном потому, что она использует сложную систему сжатия данных, опираясь на ряд оптимизированных алгоритмов записи размельчения и повторной сборки.
Это позволяет получать данные с разбивкой, организованный в вложенном формате, и вновь всякий раз, когда запрашивается.
Формат Паркет может также использоваться вне экосистемы Hadoop, будучи специально разработан, чтобы быть агностиком, насколько это возможно, работать с любым типом структуры обработки данных и модели хранения данных.
< сильный> Что нового в этом выпуске:
- Переименовать пакеты и Maven координаты org.apache
- Добавить статистику кодирования в ColumnMetaData li>
- Streaming бережливость API
- Новые логические типы
Что нового в версии 2.3.0:
- Переименовать пакеты и Maven координаты org.apache
- Добавить статистику кодирования в ColumnMetaData li>
- Streaming бережливость API
- Новые логические типы
Ограничения
- Проект все еще находится в стадии разработки в хранилище Apache Incubator и может существенно меняться от версии до версии.
Комментарии не найдены