Яка різниця між групуванням і дискретизацією?

Дискретизація — це засіб розділення безперервних даних на набір «бінів», де кожен бін представляє діапазон безперервної вибірки, а елементи потім поміщаються у відповідний бін — отже, термін «бінінг».

Групування (також називається дискретизація) — це широко використовуваний підхід до попередньої обробки даних. Він складається з сортування безперервних числових даних у дискретні інтервали, або «біни». Ці інтервали або біни можуть бути згодом оброблені так, як якщо б вони були числовими або, частіше, категоріальними даними.

Наприклад, значення атрибутів можна дискретизувати шляхом застосування групування однакової ширини або рівночастотного групування, а потім замінюючи кожне значення біна середнім значенням або медіаною, як у згладжуванні за допомогою bin середніх або згладжування bin медіан, відповідно.

Ми рекомендуємо чотири типи стратегій групування для числових функцій:

  • Медіанно-центроване групування.
  • Дискретне групування (для числових або категоріальних функцій)
  • Бункери однакової ширини.
  • Спеціальні бункери.

Телевізійне мовлення є ще одним чудовим реальним прикладом, який використовує дискретизацію. Зображення, зняті відеокамерою, перетворюються на цифровий сигнал (дискретний сигнал) перед передачею, а потім реконструюються в зображення на екрані телевізора.

Дискретизація даних, також відома як групування, це процес групування безперервних значень змінних у безперервні інтервали. Ця процедура перетворює неперервні змінні в дискретні змінні, і вона зазвичай використовується в інтелектуальному аналізі даних і науці про дані, а також для навчання моделей для штучного інтелекту.