Що таке схема кодування 1-of-K?
Якщо є K класів, ми використовуємо схему кодування 1-of-K, у якій t — це вектор довжини K, що містить одну 1 для правильного класу та 0 в інших місцях. – Ми можемо інтерпретувати вектор t як вектор класових ймовірностей.
Схема кодування 1-of-K Це означає, що точка даних не може належати двом кластерам одночасно. У цьому випадку для кожної точки даних x ми вводимо відповідний набір бінарних індикаторних змінних rnk ∈ {0,1}. Мета полягає в тому, щоб вибрати значення для {rnk} і {μk} так, щоб мінімізувати J.
Іншими словами, це кодування 1-of-C те саме, що й кодування ефектів, за винятком того, що останнє категоріальне значення має 1,0 у першій позиції масиву та значення 0,0 у всіх інших позиціях c-1.
Одночасне кодування — це техніка представлення категоріальних даних у вигляді числових векторів, де кожна унікальна категорія представлена двійковим стовпцем зі значенням 1 вказує на його наявність і 0 вказує на його відсутність.
Функція one_hot надає простий інтерфейс для перетворення цілих чисел мітки класу в так званий одноразовий масив, де кожна унікальна мітка представлена як стовпець у новому масиві. Наприклад, припустімо, що ми маємо 5 точок даних із 3 різних класів: 0, 1 і 2.
1000 у двійковій системі 1111101000. На відміну від десяткової системи числення, де ми використовуємо цифри від 0 до 9 для позначення числа, у двійковій системі ми використовуємо лише 2 цифри, тобто 0 і 1 (біт). Ми використали 10 біт для представлення 1000 у двійковій системі.