DataFu был разработан в LinkedIn и полностью написана на Java.
DataFu включает в себя функции / библиотеки для работы с:
- Статистика
- Оценка
- отбор проб
- Сессии
- Link Analysis
- Установить операции
- Сумки
DataFu идеально подходит для интеллектуального анализа данных и статистических приложений, работающих поверх баз данных Hadoop или свиньи.
Эти функции позволяют разработчикам в полной мере воспользоваться всеми данными, хранящимися внутри Hadoop или Свиньи базы данных без необходимости иметь дело с огромными требованиями к системе для того, чтобы сделать это.
Что нового в этом выпуске:.
- Пара UDF, для простой случайной выборки с заменой
- Дополнительные зависимости в настоящее время упакованы в DataFu необходимых зависимостей так меньше JAR.
<Литий> SetDifference ОДС для вычисления разность множеств (например А-В или А-В-С).
Что нового в версии 1.2.0:
- Пара UDF, для простой случайной выборки с заменой.
- Дополнительные зависимости в настоящее время упакованы в DataFu необходимых зависимостей так меньше JAR.
<Литий> SetDifference ОДС для вычисления разность множеств (например А-В или А-В-С).
Что нового в версии 1.1.0:.
- Добавлена ША хэш UDF
- InUDF и AssertUDF добавлены для свиней 0,12 совместимости. Они такие же, как в и Assert.
- SimpleRandomSample, который реализует масштабируемую простой алгоритм случайной выборки.
Комментарии не найдены