Яка різниця між іскрою 2 і 3?
Ці вдосконалення роблять Spark 3 швидший і ефективніший, ніж Spark 2. API Python: Spark 3 містить новий API Pandas UDF, який дозволяє користувачам застосовувати спеціальні функції Python до Spark DataFrames. Це полегшує роботу з даними Spark у Python, яка є популярною мовою для аналізу даних і машинного навчання.
Підвищення продуктивності Spark 3 значне підвищення продуктивності в таких сферах, як виконання запитів і перемішування даних, зокрема: векторизований механізм виконання, який може значно покращити продуктивність певних типів запитів.
Ось найбільші нові функції в Spark 3.0: Подвійне підвищення продуктивності TPC-DS порівняно з Spark 2.4, що забезпечується адаптивним виконанням запитів, динамічним скороченням розділів та іншими оптимізаціями. Відповідність ANSI SQL. Значні вдосконалення в API-інтерфейсах pandas, включаючи підказки типу Python і додаткові UDF-файли pandas.
Тепловий рейтинг кожної свічки запалювання NGK позначається числом; нижчі числа вказують на більш гарячий тип, вищі числа вказують на більш холодний тип.
Tecno Spark 3
Запуск | |
---|---|
Оголошено | 2019, квітень |
Статус | в наявності. Випущено 2019, квітень |