Понимание показателей оценки ML-точности и отзыва

2019-08-19 00:58

Жаргон мира машинного обучения имеет решающее значение, чтобы показать, насколько хорошо работает ваша модель

Прикосновение к базе, цитирование номера парка мяча, удар по нему из парка, это совершенно новая игра в мяч-все это примеры жаргона, заимствованного из мира бейсбола и широко используемого (или неправильно используемого в некоторых случаях) в корпоративном мире.

Мир машинного обучения аналогичным образом использует набор терминов регулярно, чтобы указать, насколько хорошо работают модели. Возникает вопрос-зачем нам нужно что-то еще, кроме термина точность? Точность просто определяется как

Нет. правильных прогнозов, деленных на общее количество прогнозов

Теперь представьте, что у онколога, специалиста по раку молочной железы, 1000 пациентов. Он решает объявить всех своих пациентов свободными от рака, но позже узнает, что у 3 из них действительно был рак. Для врача это все еще означает точность 99,7%, но для этих 3 пациентов результаты очень тяжелые. Таким образом, это ловушка для использования только точности в качестве показателя успеха.

Такие "наивные" результаты получаются, когда мы сталкиваемся с несбалансированным набором данных. Несбалансированный набор данных-это тот, который имеет слишком мало примеров одного вида.
Использование точности и отзыва в реальном мире

Точность, отзывчивость, чувствительность и специфичность-это термины, которые помогают нам распознать это наивное поведение. Обычно команды ML в таких компаниях, как Microsoft, Amazon, просят своих сотрудников цитировать номера PR (точность и отзыв) или цитировать чувствительность и специфичность результатов.

Эти цифры помогают нам понять, что актуально в данных

Давайте разберемся с примером. Допустим, наш онколог лечит 1000 пациентов.

Он заявляет, что 950 из них свободны от рака. При этом он делает 10 ошибок. 940 из них он правильно диагностирует, чтобы быть свободным от рака. Несчастные 10 имеют рак, но избежать внимания врача.
Он диагностирует оставшиеся 50, чтобы иметь рак. Из них только 5 пациентов действительно имеют рак. Остальные 45 пациентов не имеют рака, но были неправильно идентифицированы как раковые больные.

В конце концов у нас есть 4 набора пациентов. Давайте обозначим все эти 4 вида пациентов.

Истинно положительные (ТП) -5 пациентов, которые дали положительный результат на рак правильно
Ложные срабатывания (FP) -45 здоровых пациентов, которые тестируются положительно неправильно
Истинно отрицательные (Теннесси) — 940 здоровых пациентов, который испытал недостаток для Рака правильно
Ложные негативы (FN) — 10 пациентов, которые имели рак, но были объявлены отрицательными для Рака неправильно

Слово "позитивный" означает " да " на вопрос, который мы задаем. например, есть ли у этого человека рак? Положительным было бы, когда мы говорим: "Да, у этого человека рак". Отрицательный тогда будет означать, когда мы говорим, что "у этого человека нет рака".

Давайте рассмотрим эти 4 термина в наглядном виде

Приведенная выше таблица широко известна как матрица путаницы. Запутался, а? Не быть Эта матрица становится решением наших проблем. Учитывая эту матрицу, мы можем легко вычислить все термины, о которых мы говорили до сих пор.

Сначала давайте посмотрим, насколько точным был доктор. Количество правильных решений, принятых доктором, обозначено как «истинно».

Источник: medium.com

Понимание показателей оценки ML-точности и отзыва

Комментарии: