Яка різниця між групуванням і дискретизацією?
Дискретизація — це засіб розділення безперервних даних на набір «бінів», де кожен бін представляє діапазон безперервної вибірки, а елементи потім поміщаються у відповідний бін — отже, термін «бінінг».
Групування (також називається дискретизація) — це широко використовуваний підхід до попередньої обробки даних. Він складається з сортування безперервних числових даних у дискретні інтервали, або «біни». Ці інтервали або біни можуть бути згодом оброблені так, як якщо б вони були числовими або, частіше, категоріальними даними.
Наприклад, значення атрибутів можна дискретизувати шляхом застосування групування однакової ширини або рівночастотного групування, а потім замінюючи кожне значення біна середнім значенням або медіаною, як у згладжуванні за допомогою bin середніх або згладжування bin медіан, відповідно.
Ми рекомендуємо чотири типи стратегій групування для числових функцій:
- Медіанно-центроване групування.
- Дискретне групування (для числових або категоріальних функцій)
- Бункери однакової ширини.
- Спеціальні бункери.
Телевізійне мовлення є ще одним чудовим реальним прикладом, який використовує дискретизацію. Зображення, зняті відеокамерою, перетворюються на цифровий сигнал (дискретний сигнал) перед передачею, а потім реконструюються в зображення на екрані телевізора.
Дискретизація даних, також відома як групування, це процес групування безперервних значень змінних у безперервні інтервали. Ця процедура перетворює неперервні змінні в дискретні змінні, і вона зазвичай використовується в інтелектуальному аналізі даних і науці про дані, а також для навчання моделей для штучного інтелекту.