Який метод вибору ознак для класифікації даних мікроматриці?
SVM є одним із найкращих варіантів вибору функцій і найчастіше використовуваним класифікатором для даних мікроматриць. Однак більшість цих SVM є типовими машинами підтримки векторів, тобто всі ці SVM базуються на техніці ядра (як правило, це лінійне ядро) і подвійному розв’язнику Лагранжа (наприклад, [11]).
Ієрархічна кластеризація та k-середня кластеризація широко використовуються методи аналізу мікрочипів.
Оцінка Фішера. Оцінка Фішера є одним із найпоширеніших методів вибору контрольованих ознак. Алгоритм, який ми будемо використовувати, повертає ранги змінних на основі оцінки Фішера в порядку спадання. Потім ми можемо вибрати змінні відповідно до випадку.
метод | Корекція фону | Нормалізація |
---|---|---|
dChip | Віднімається ММ | Сплайн підігнаний до набору інваріантів рангу |
RMA | Глобальна корекція | Квантиль |
ZAM | Подібно до RMA | Усереднений попарний лес |
GL | Жодного | лес, підігнаний до підмножини |
Наприклад, методи на основі фільтрів, такі як тест хі-квадрат або взаємне отримання інформації зазвичай використовуються для вибору ознак у категоріальних даних. Для числових даних підходять методи на основі оболонки, такі як вибір вперед або назад.