Який метод вибору ознак для класифікації даних мікроматриці?

SVM є одним із найкращих варіантів вибору функцій і найчастіше використовуваним класифікатором для даних мікроматриць. Однак більшість цих SVM є типовими машинами підтримки векторів, тобто всі ці SVM базуються на техніці ядра (як правило, це лінійне ядро) і подвійному розв’язнику Лагранжа (наприклад, [11]).

Ієрархічна кластеризація та k-середня кластеризація широко використовуються методи аналізу мікрочипів.

Оцінка Фішера. Оцінка Фішера є одним із найпоширеніших методів вибору контрольованих ознак. Алгоритм, який ми будемо використовувати, повертає ранги змінних на основі оцінки Фішера в порядку спадання. Потім ми можемо вибрати змінні відповідно до випадку.

методКорекція фонуНормалізація
dChipВіднімається ММСплайн підігнаний до набору інваріантів рангу
RMAГлобальна корекціяКвантиль
ZAMПодібно до RMAУсереднений попарний лес
GLЖодноголес, підігнаний до підмножини

Наприклад, методи на основі фільтрів, такі як тест хі-квадрат або взаємне отримання інформації зазвичай використовуються для вибору ознак у категоріальних даних. Для числових даних підходять методи на основі оболонки, такі як вибір вперед або назад.