Антихайп пост: что могут нейронные сети, а что нет

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2023-04-11 09:35

Трезво про ИИ

Если спросить у молодежи что самое хайпонутое сейчас, ответ будет: биткоин, майнинг, спиннер ( куда же без них) и deep learning. Про последнее я и хотел бы поговорить, чтобы разбить весь хайп в пух и прах. Поговорить о том, что могут нейронные сети, а что нет. Постараюсь без сложных математических терминов, поехали!

Итак, начнем с самого начала. Что такого в этом Machine learning'е? Представьте процесс написания программы. У вас есть входные данные, вам надо получить выходные. Вы пишете алгоритм и получаете результат. В мл все по другому - у вас есть входные данные, вам надо получить алгоритм их обработки.

Продолжим.

Миф №1. Искусственные нейронные сети копируют наш мозг

В корне неверно. В нашей головной помойке ( возьмем то, что у большинства ) по-мимо нейронов есть еще множество клеток, в том числе и различные нейромедиаторные рецепторы.

Правда №1. Искусственные нейронные сети - это просто последовательность произведения матриц ( "табличек").

Да, это действительно так. Передача импульса от начала до конца описывается произведением матриц. И не какой-то сложной, а самой простой - линейным уравнением.

Выход равен всего лишь этому!

out = activation(Wx + b)

activation - функция активации, может слышали такое понятие как "активация нейронов". Просто так сказать "изменяет вид" выходных значений, чтобы например незначительные сигналы были равны нулю, как пример.

x - вектор входных сигналов слоя, W - матрица весов, b - специальная штука называемая "нейронами смещения", поскольку не принимает на вход совсем ничего, а служит просто для упрощения нахождения решения ( дабы не говорить вам про смещения графиков ;) ) она в данном случае не важна.

Все! Да да! 5 слоев будет просто 5 таких уравнений....

Нейронная сеть не может думать, это просто преобразования информации. В самом начале матрицы параметров инициализируются случайным образом, в итоге от входного вектора ( вектор - просто последовательность чисел вроде [1,2 4, 5, 4, 3, 2] ) в выходное значение. Все! Больше ничего. Совсем.

Выходное значение дальше сравнивается с правильным, а веса подгоняются так чтобы в следующий раз она дала более лучший результат. Это и есть процесс обучения, такой распиаренный. Как видите, скайнетом тут даже не пахнет!

Данная простейшая архитектура нейронных сетей используется для регрессии: предсказании чего-либо, например, курса валют ( ;) ), или классификации, на распознавании рукописного текста дают точность близкую к 90%, а это самая простая модель! Естественно пойдут всякие разговоры про скайнет и прочую чепуху)

Миф №2. Нейронные сети могут творить.

В каком-то смысле это так. Они могут рисовать изображения, могут сочинять стихи, музыку... Но это все основано на той же самой подгонке матрицы, когда несколько входных данных комбинируются в один, а на выходе получается нечто среднее. Так, например, работают стилизаторы изображений, но это не творение. Они не творят, это по-сути плагиат. Это все равно, что если бы вы взяли кусок одного романа, впихнули в другой роман и назвали новым произведением.

Правда №2. Нейронные сети могут создавать стихи, общаться с человеком, делать качественный перевод

Да! Но это, опять же, не творение. Вы уже знаете как они обучаются, и понимаете что в этом нет ничего удивительного. Специальные модели ( именно так называются нейронные сети в научной среде ) обучают на входных данных, чтобы они выдавали соответствующий, нужный результат... Различия лишь в используемых архитектурах - сверточные сети для распознавания изображений, rnn/lstm - анализ последовательностей, и иже с ним.

Миф №3. Они появились недавно

Никак нет, сэр. Даже самые продвинутые архитектуры "современные", которые используются для распознавания речи, изображений, псевдотворения были изобретены в 20 веке. Удивлены? А нет ничего удивительного - компы то были слабыми. Нейронные сети чрезвычайно медленные из-за того самого процесса "подгонки" параметров....

Правда №3. Они могут находить новые закономерности и самообучаться.

Да, до этого мы расматривали обучение с учителем, когда был дан идеальный результат.

А существуют еще задача кластеризации - выделения общих признаков ( кластеров ) в какой-то куче навозного мусора, и работают они довольно годно, круче человека в сотни раз. Эх, вот где годнота-то!

А еще они могут выбрать отпехать красивую девчонку, вместо того чтобы сожрать морожку. Тут все просто. В искусственные нейронные сети взяли и добавили один из нейромедиаторов - дофамин, и теперь она ищет удовольствия. Эх, вот где надо бояться))))

Миф №4. Нейронные сети приведут к сильному искусственному интеллекту, сопоставимого с человеческим сознанием.

Нет, нет, и еще раз нет! Нейронные сети - это просто тупой и сухой линал, линейная алгебра, как угодно, но не интеллект. Это преобразования матриц, из одних в другие. Ничего более. Если и будет создан сильный ИИ, то нейронные сети будут небольшим винтиком.

Правда №4. Нейронные сети могут принимать решения.

Да, связано с это с так называемой техникой reinforcement learning, в которую как раз и добавили дофамин и нейронные сети. Она ищет наиболее выгодный исход и выбирает его. Так, например, AlphaGo победила чемпиона по самой сложной настольной азиатской игре - Го.


Источник: vk.com

Комментарии: