Який зв'язок між CDF і гістограмою?
Діаграми CDF або кумулятивної функції розподілу відображають ту саму інформацію, що й гістограми. Різниця в тому, що значення гістограми підсумовуються зі збільшенням інтенсивності флуоресценції; таким чином, CDF починається з 0% (початок) і закінчується на 100% (максимальне значення Y).
По суті, і гістограма, і CDF (функція кумулятивного розподілу) відображають подібну інформацію, але різними способами. Гістограму можна розглядати як емпіричну оцінку функції щільності ймовірності (PDF), яка представляє ймовірність із площами.
Гістограми — це стовпчасті діаграми… тому, я думаю, ми можемо сказати, що вони представляють це площею стовпчика. CDF є інтегралом PDF, є кумулятивним і представляє ймовірність із вертикальними відстанями. eCDF – це емпірична оцінка CDF.
На відміну від гістограми, яка має обмежену кількість бінів, в ідеалі кумулятивний графік частот має мати одну точку для кожного елемента даних. Навіть у невеликих наборах даних (наприклад, зображення 200 × 200) це призведе до необґрунтовано великої кількості точок для побудови (40 000)!
eCDF відображає ваші дані в послідовності, показуючи кумулятивний розподіл вашої змінної та відображає зміни вашої змінної зі змінами нахилу. Гістограма показує розповсюдження ваших даних і частоту значень у кожному біні.
Показано графік кумулятивної функції розподілу (CDF). ймовірність події, що відбудеться з часом, як показано на наступному зображенні. Пунктирна лінія показує, що в певний момент часу можна визначити ймовірність відмови або ненадійності.