«Критика чистого разума» Иммануила Канта

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2021-03-06 04:18

Философ Диана Гаспарян о главной работе Иммануила Канта, устройстве познания и его границах

«Критика чистого разума», главный философский труд Иммануила Канта, вышла в свет в 1781 году, явившись результатом стремительного написания после многолетних раздумий. Перед ее созданием Кант сообщал, что удерживать в голове столь сложный материал далее не представляется возможным и его требуется срочно записать.

Понимание «Критики» отягощается тем, что ее текст написан специальным языком и читателю без философской подготовки малодоступен. В предисловии Кант приводит остроумную цитату: «Если измерять объем книги не числом листов, а временем, необходимым для того, чтобы ее понять, то о многих книгах можно было бы сказать, что они были бы значительно короче, если бы они не были так коротки». Если применить это наблюдение к самой «Критике», то ее можно счесть весьма объемной, так как многие идеи даны в ней схематично. Поэтому если для понимания самой общей мысли «Критики» понадобится не более часа, то для прояснения деталей потребуются годы.

Существует две «Критики», и это стоит учитывать желающим освоить ее содержание. Наличие двух изданий связано с тем, что по итогам прочтения первого издания читатели причислили Канта к последователям субъективного идеализма, не разглядев в нем создателя совершенно нового философского течения — трансцендентального идеализма. Чтобы разрешить это недоразумение, Канту пришлось подготовить второе издание, где он специально оговорил различие между субъективным и трансцендентальным идеализмами.

FAQ: «Критика чистого разума» Иммануила Канта

Смысл названия «Критика чистого разума»

«Чистый», согласно Канту, означает «свободный от опыта». Чтобы не запутаться в тексте, опыт нужно понимать в двух значениях: 1) как данные наших ощущений и 2) как метод множественных (экспериментальных) проверок. Дальше мы будем говорить об опыте в первом значении, о втором значении скажем отдельно.

Соответственно, «чистый разум» — это разум, к которому не примешивается ничто, взятое из опыта. Основу такого разума составляют наши собственные познавательные способности, которые лишь обрабатывают поступающие извне сигналы, но сами не формируются благодаря им.

«Критика», в свою очередь, означает, что мы должны выяснить устройство познавательных способностей, составляющих чистый разум, и показать границы этих способностей: что они могут и чего не могут.

Пространство по Ньютону и пространство по Лейбницу

Одним из толчков к написанию «Критики» стала проблема пространства, над которой бились ученые и философы того времени. Интуитивно пространство мыслится независимым от любых вещей, своего рода пустотой. Пустота должна быть поистине пуста. Она не может состоять из чего-то, поскольку всякое что-то, чтобы существовать, вначале должно куда-то помещаться. Получается, что пустота — это ничто (небытие, несуществующее), которое, следовательно, не может существовать. Но как-то, что не существует, вмещает в себя все то, что существует?

В процессе решения этой проблемы схлестнулись две точки зрения — Ньютона и Лейбница.

Согласно Ньютону, в понимании пространства стоит довериться интуиции. Пространство абсолютно: даже если исчезнут все вещи, то останется занимаемое ими место. Недостаток этой теории в ее парадоксальности: приходится закрывать глаза на то, что пространство в виде пустоты трудно мыслить существующим. Стараясь сгладить парадокс, Ньютон предложил рассматривать пустоту как заполненную эфиром, который, не будучи вещью, представлял собой хоть что-то, что существует. Однако полностью избавиться от недоразумений эта идея не помогала.

Лейбниц, избегая опасностей ньютонианской теории, отказывал пространству в абсолютности и считал его относительным свойством самих вещей. Согласно Лейбницу, если мы не хотим приравнивать пространство к пустоте, его нельзя считать чем-то самостоятельным (субстанциальным) или абсолютным. И тогда лучше объявить протяженность (пространственность) принадлежащей самим вещам. Это значит, что если исчезнут все вещи, то исчезнет и пространство. Придерживаясь аристотелевского принципа «Природа не терпит пустоты», Лейбниц объяснял, что пространство есть своего рода охват одной вещи другой и в отсутствие самих вещей теряет всякий смысл. Недостатком данной трактовки является ее контринтуитивность. Обычно мы считаем, что после устранения всех вещей остается место, которое само не устранимо.

Кант предложил революционное решение парадокса пространства. Оно явилось ему в виде инсайта после размышления над так называемым принципом неконгруэнтных подобий. Суть принципа проста: как известно, при полном физическом сходстве перчатки надеваются на разные руки, а ботинки на разные ноги. Следовательно, пространство не является свойством самих вещей и чем-то относительным, как думал Лейбниц. Значит, оно абсолютно, а Ньютон прав? В отличие от Ньютона, Кант скажет, что пространство хоть и абсолютно, но необъективно. Оно не расположено в том же мире, где расположены сами вещи. При этом, даже если никаких вещей не будет, оно сохранится. Как такое возможно? Все просто. Достаточно сказать, что пространство неустранимо (абсолютно), но связано не с объективным миром, а с наблюдателем. Пространство — это то, что привносится самим субъективным наблюдением и без чего наблюдение невозможно. Сочетание абсолютного и субъективного Кант и будет считать впоследствии одним из значений трансцендентального.

Понятие трансцендентального познания

Трансцендентальным является «познание, занимающееся не столько предметами, сколько видами нашего познания предметов, поскольку это познание должно быть возможным a priori». Эта основополагающая формулировка подразумевает, что всякое познание должно начинаться с условий возможности того опыта, который мы имеем. Условия возможности — это те познавательные способности, с помощью которых мы формируем свой собственный опыт. Прежде чем найти в мире вещи, мы как активные познающие существа должны «подогнать» нечто, что еще не стало вещью-для-нас, под возможности нашего восприятия. Это нечто, так называемые вещи-в-себе, не может восприниматься напрямую. Значит, чтобы восприятие состоялось, наши познавательные способности должны «потрудиться» над их оформлением. Так, вначале опыт должен быть упорядочен во времени и пространстве. А то или иное событие мы обязательно должны включить в череду причин и следствий. По-другому воспринимать мир мы просто не можем.

В результате обработки внешних впечатлений, которые, как говорит Кант, аффицируют нас (влияют на нас), мы и получаем опыт. То есть опыт не является чем-то первичным и нейтральным. Его еще надо «сделать». Этим заняты наши так называемые априорные формы чувственности и рассудка. Иными словами, когда я вижу перед собой стол, то моя априорная чувственность уже структурировала этот объект в пространстве и времени и упорядочила в причинно-следственные ряды. Априорные способности «изготавливают» для нас объекты мира и в конечном итоге тот мир, в котором мы будем жить.

Соответственно, философия, которая будет интересоваться этими способностями, будет называться трансцендентальной.

Трансцендентальная эстетика

Эстетикой Кант называет учение о чувственности (чувствах). С помощью чувств вещи нам даются. Но чувства бывают разные. Восприятие холода, жара, сладкого, кислого и миллиона других впечатлений суть апостериорные или эмпирические чувства. Разными людьми они переживаются по-разному, и мы всегда можем представить мир, в котором исчезло все сладкое или кислое.

Но есть также априорные, или трансцендентальные, чувства (или, правильнее сказать, формы чувственности). Их у нас только две: пространство и время. Всеми людьми они переживаются одинаково, и при всем старании нам не дано представить мир вне времени и пространства (чтобы в этом убедиться, стоит попробовать это сделать).

По аналогии с решением проблемы пространства Кант решил и вопрос времени. Пространство и время не объективные характеристики мира, а те фундаментальные структуры чувственности самого субъекта, которые формируют мир предметов нашего опыта. До того пока наши чувственные впечатления не будут оформлены надлежащим образом, человек не сможет ничего воспринять. Так же как мы не различаем цвета или звуки определенной пороговой величины, человек не может ничего различить в мире, пока не пропустит сигналы, поступающие из мира, через априорные формы времени и пространства.

Эти формы одинаково переживаются всеми людьми, и мы не можем представить отсутствие времени, равно как и пространства. Поэтому мы все живем в одинаковом мире, в котором есть пространство и время и который называем объективным. Но эту объективность изготовили мы сами. Мы сами сотворили ту физику мира, которую потом изучает наука. Природа включает в себя законы нашего собственного восприятия.

Сказанное можно понять так, что мы обладаем определенной системой восприятия в силу организации нашего тела (например, муравей или слон чувствуют по-другому), но это не вполне корректное упрощение, так как наше тело как объект в том числе изучения уже есть результат определенным образом организованного восприятия. Поэтому объяснять происхождение априорных форм чувственности особенностями организации человеческого тела нельзя. Строго говоря, мы не знаем, почему обладаем этими, а не другими формами чувственности. Они просто даны как факт, объяснить который мы вряд ли сможем.

Трансцендентальная аналитика

Аналитикой Кант называет учение о рассудке. Рассудок есть то, с помощью чего вещи мыслятся. Наряду с априорными формами чувственности у нас есть также априорные формы рассудка. Они позволяют упорядочить и объяснить все возможные логические операции нашего мышления. Их можно подразделить на четыре большие подгруппы: операции с качеством, с количеством, с отношениями и с модальностью. Какой бы материал ни поступил к нам, наше мышление будет оперировать с ним одним из логических способов, описанных в подгруппах. Например, чтобы мыслить событие, мы также должны мыслить, что оно в обязательном порядке имеет причину и способно к неким последствиям. Высказывая суждение, мы всегда что-то либо утверждаем, либо отрицаем. Мы также должны определиться с модальностью: событие должно или только может случиться; уже случилось или еще только собирается. Мы также всегда держим в голове количественную характеристику события или объекта (все, ни один, некоторые).

Таким образом, мыслить — значит совершать определенные логические операции. Обычно подробным разъяснением наших мыслительных способностей занимается такая дисциплина, как логика. Заслуга Канта состоит в том, что он не просто описал эти операции, но и сообщил их природу. Они врождены нам и априорны, то есть не берутся в нашем мышлении из опыта, но представляют собой устройство самого мышления. Будучи сугубо формальными, они отвечают за обработку тех впечатлений, которые мы получаем извне.

Трансцендентальная диалектика — роль разума

Над рассудком возвышается разум. Рассудок сугубо инструментален и лишь обрабатывает те впечатления, которые поступают к нему извне. Никакой внутренней целевой природой он не обладает. Правильнее всего было бы сравнить рассудок с работой компьютерной программы, которая обрабатывает данные согласно заданному алгоритму. Напротив, разум обладает кое-какой направляющей и консолидирующей наши технические рассудочные навыки силой. Он состоит из трех больших областей — так называемых регулятивных идей, назначение которых в том, чтобы регулировать работу рассудка. Эти идеи — Бог, Душа и Мир. Благодаря им разрозненные знания, продуцируемые нашим рассудком, упорядочиваются в некую связную картину. У нас есть представление о сознании субъекта (Душа), о мире в целом (Мир) и, возможно, некотором смысле, присущем этому миру (Бог).

Кантовский аргумент в пользу существования априорного знания

Априорным в философии называется знание, происхождение которого не связано с чувственным опытом. К этому, например, можно отнести математику или логику. Но не все философы убеждены в априорном происхождении подобных дисциплин. Многие настаивают на том, что представление о числе появляется у нас только после того, как мы недосчитаемся реальной груши, которую намеревались съесть, а о тождестве, после того как экспериментальным путем убедимся, что груши не могут превращаться в яблоки.

Сам Кант не сомневался в существовании априорного знания. Его аргумент состоял в том, что никакой опыт не может придать знанию всеобщность и необходимость, то есть силу закона. Наблюдение может быть сколь угодно длительным и повторяющимся (здесь речь как раз идет о втором «экспериментальном» значении «опыта»), но переход от наблюдения к идее закономерности представляет собой проблему. Между тем в науках имеются всеобщие и необходимые суждения, следовательно, нам надо понять, как они туда попали. Для этого необходимо исследование самой возможности имеющегося у человека априорного знания.

Без сомнения, всякое наше познание начинается с опыта, но отсюда вовсе не следует, что оно целиком происходит из опыта.

Всего одной этой фразой Кант разом разрешил вековой спор между эмпириками и рационалистами по вопросу источника возникновения знания. Если эмпирики считали, что все наше знание происходит из чувственного опыта, то рационалисты настаивали на том, что мышление содержит в себе целый ряд так называемых врожденных идей, с опытом не связанных. Этих идей достаточно, чтобы человек мыслил даже при полном отсутствии доступа к опыту.

На стороне эмпиризма был здравый смысл и очевидные факты: узнать о том, что огонь жжет, а вода утоляет жажду, можно только на опыте, и роль чувственности здесь критична. Формирование ребенка в условиях дефицита ощущений должно привести к существенной атрофии когнитивных способностей.

Аргументы рационалистов были более замысловаты, но не менее убедительны: анализируя мышление человека, мы находим в нем такие идеи, которые никак не могли быть почерпнуты из опыта. Идеи числа, тождества, абсолютности, причинности, ничто, бесконечности и другие есть в голове каждого мыслящего существа, но показать, из какого конкретного чувственного материала эти идеи возникли, на самом деле невозможно. Ни бесконечность, ни что-либо абсолютное, ни что-либо совершенно одинаковое (тождественное) мы ни разу не видели в чувственно наблюдаемом мире. Откуда же у нас взялись эти идеи? Они всегда уже были в мышлении, отвечали рационалисты. Кант, в свою очередь, пишет:

«Никакое познание не предшествует во времени опыту, оно всегда начинается с опыта. Но хотя всякое наше познание и начинается с опыта, отсюда вовсе не следует, что оно целиком происходит из опыта. Вполне возможно, что даже наше опытное знание складывается из того, что мы воспринимаем посредством впечатлений, и из того, что наша собственная познавательная способность (только побуждаемая чувственными впечатлениями) дает от себя самой, причем это добавление мы отличаем от основного чувственного материала лишь тогда, когда продолжительное упражнение обращает на него наше внимание и делает нас способными к обособлению его».

Таким образом, опыт лишь запускает программу обработки данных, он «включает» мышление и снабжает его данными. Но последующий алгоритм обработки протекает по своим собственным законам и принципам, опыт никак не вмешивается в его работу. Как правило, наше знание дается нам единым нерасчлененным потоком. «Во времени» никакого опережения между познанием и опытом нет, и, чтобы различить эти два уровня, требуется особая философская работа. Ошибка и эмпириков, и рационалистов заключалась в том, что они отсекали либо опыт, либо внутреннюю структуру самого мышления или настаивали на предшествовании одного другому, в то время как одно без другого просто не существует. Решение Канта примирило аргументы сторон, а именно здравый смысл эмпириков с логическими доводами рационалистов. Кроме того, идеи Канта отлично согласуются с некоторыми современными когнитивными теориями.

FAQ: «Критика чистого разума» Иммануила Канта

Главный вопрос «Критики»: как возможно априорно-синтетическое знание?

Все знание, доступное человеку, можно поделить на два типа: апостериорное, полученное из опыта, и априорное, с опытом не связанное. Знание передается суждениями, соответственно, и все суждения можно поделить на два типа: аналитические и синтетические.

Аналитические суждения — это такие суждения, предикат которых уже входит в содержание субъекта и ничего не добавляет к тому, что мы знали о субъекте. Аналитические суждения являются тавтологиями, пусть не всегда явными. Например, суждения «Время течет», «Всякий физический объект имеет форму», «Все философы любят мудрость» являются аналитическими, так как признаки «текучести», «оформленности» и «любви к мудрости» уже мыслятся в содержании понятий «время», «физический объект» и «философ» соответственно. Сам Кант приводит такой пример: «Все тела протяженны (занимают место в пространстве)». Действительно, всякое тело всегда мыслится протяженным (пространственным), и поэтому достаточно немного подумать, и мы извлечем из понятия тела понятие протяженности, не прибегая ни к какому опыту. Такие суждения только поясняют наше знание.

Синтетические суждения — это такие суждения, предикат которых, наоборот, добавляет, приписывает к содержанию субъекта что-то, что в самом субъекте логически не содержится. Например, суждения «Яблоко зеленое», «Некоторые физические объекты являются мячами», «Кенигсберг — родина Канта» являются синтетическими, так как признаки «зеленого цвета», «быть мячом» и «быть родиной» не входят изначально в содержание предиката. Кант приводит пример «Все тела имеют тяжесть». В случае синтетических суждений размышлять над содержанием субъекта бессмысленно: предикат мы оттуда не извлечем, нужно обратиться к опыту. Такие суждения расширяют наше знание.

Нетрудно догадаться, что в норме все апостериорные суждения должны быть синтетическими, а все априорные — аналитическими. Но Кант открыл третий, не совсем нормальный тип суждений, а именно априорно-синтетический. По логике таких суждений быть не должно. Нельзя узнать что-то новое о том, что не взято из опыта. Между тем такие суждения есть, и этот факт требует объяснения. Априорно-синтетические суждения в избытке содержатся в первую очередь в области математики. Практически все ее положения расширяют наше знание, притом что все они обладают всеобщностью и необходимостью.

Например, суждения «Кратчайшим расстоянием между двумя точками является прямая линия» и «5+7=12» не являются поясняющими тавтологиями. Как бы тщательно мы ни размышляли над понятием точки и прямой, мы не дедуцируем оттуда истину о кратчайшести расстояния. Равно подсчет чисел не является повтором того, что мы уже и так знали. Это особенно очевидно в случае больших чисел. Вряд ли мы скажем, что наше знание о том, чему равняется сумма 4985 и 5869, тождественно знанию о том, что если смертны все люди, то смертен и Сократ. Математика и логика суть разный тип дисциплин.

Естествознание также заключает в себе априорные синтетические суждения. Таковы суждения: «При всех изменениях физического мира количество материи остается неизменным» или «При всякой передаче движения действие и противодействие всегда должны быть равны друг другу». Они явно расширяют наше представление о мире, но имеют для нас силу закона.

Есть они и в философии: «Все, что происходит, имеет свою причину». События, которые мы наблюдаем в мире, просто сменяют друг друга. При этом мы узнаем массу нового, установление причинно-следственных отношений необыкновенно расширяет наш опыт. Но почему мы вообще приписываем смене событий характер причинности? Всего лишь пару раз пронаблюдав последовательность событий, допустим нагревание воды и последующее ее закипание, мы придаем этой последовательности характер закона. И это притом, что каждому из нас известен опыт ошибочного установления причинности. Множественное повторение, входящее в природу нашего опыта, не в состоянии придать нашим наблюдениям характер абсолютной уверенности. Ведь корреляция событий вовсе не то же самое, что их каузация. Так, из того, что человек встал со скамейки вокзала и в этот момент подошел поезд, не следует, что человек направился к поезду, — возможно, он решил выпить кофе. Но мы упорно спешим связать события в причинные ряды и полагаем причинность фундаментальным законом природы.

Таким образом, одна из самых непостижимых вещей, которую проделывает наше мышление, — это придание статуса закона тем открытиям, которые мы только что сделали. Следовательно, есть такое знание, которое, будучи всеобщим и необходимым, сопровождается синтетическим расширением. И хоть такое волшебное сочетание составляет мечту любой науки, нам приходится констатировать его парадоксальность. А значит, вначале требуется ответить на вопрос «Как возможны априорные синтетические суждения?». Этот вопрос Кант и объявляет главным вопросом всей «Критики».

Разделение всего мира на феномены (явления) и ноумены (вещи-в-себе)

При знакомстве с описанной выше схемой познания немедленно возникают вопросы. А откуда вообще поступают впечатления? Чем они являются и что лежит за пределами наших априорных способностей? Кант отвечает, что по ту сторону наших способностей лежит мир ноуменов, или вещей-в-себе, которые существуют независимо от нас, но никогда не смогут быть восприняты нами напрямую. (Твердое убеждение в том, что ноумены существуют и не зависят от человека и его априорных способностей, как раз и призвано было отделить кантовский трансцендентальный идеализм от субъективного идеализма Беркли.)

Мир ноуменов, или вещей-в-себе, воздействует на нас. Мы обрабатываем эти воздействия согласно нашим априорным способностям. По итогам проведенной работы мы получаем опыт, состоящий из явлений, или феноменов. Явления — это все то, что нас окружает в повседневной жизни или дается ученому в процессе исследования. Это не только голубое небо над головой, горы и леса, но и молекулярный состав воды или бактериологический анализ почвы. Все, что нам дается в ходе наблюдения, суть явления. Не забудем, что получаются явления при непосредственном участии наших познавательных способностей.

Таким образом, то, что представляют собой вещи-в-себе, мы никогда не узнаем, в то время как с познанием явлений у нас нет никаких проблем, ведь мы сами поучаствовали в их создании.

Окончательный ответ на главный вопрос

Зная этот принцип, можно теперь вернуться к главному вопросу «Критики»: как возможно априорно-синтетическое знание? Ответ будет состоять в том, что оно возможно именно благодаря разделению мира на феномены и ноумены и трансцендентальному устройству наших познавательных способностей. Если мы сами организуем тот мир, в котором живем, то из опыта всегда можно дистиллировать две составляющие: то, что относится к нашим априорным способностям, и то, что действительно пришло извне, из мира ноуменального. Первая будет отвечать за априорную часть познания, а вторая — за синтетическую.

Таким образом, с одной стороны, знание действительно прирастает, приходит извне в качестве чего-то нового, а с другой — может быть абсолютно истинным, ведь мы не можем ошибаться в том, что привнесли сами. Оно всегда будет только таким и никогда другим. Как раз то, что мы сами добавили к знанию, а именно априорные формы наших познавательных способностей, и обеспечивает всеобщность и необходимость. В чем нельзя усомниться и что всегда выглядит для нас неизменным? То, через что мы сами воспринимаем вещи. Если априорные формы — это те очки, сквозь которые мы видим мир и которые нельзя снять, то они и будут самым несомненным, что мы знаем о мире. Они и будут законами этого мира. Это обстоятельство, в свою очередь, и дает возможность утвердить претензии науки, в том числе естественно-научного знания, на абсолютную достоверность. Ведь чудесность априорно-синтетического знания не только в его парадоксальности, но и в том, что благодаря ему только и возможна наука как синтез новизны и абсолютной доказательности.

До Канта еще только зарождающаяся наука уже испытывала значительные трудности, так как в случае правоты эмпириков знание обещало быть волнующе новым, но всегда лишь относительно истинным, а в случае правоты рационалистов абсолютные истины возможны, но их количество ограниченно. Кант же попытался убедить нас в том, что мы можем уверенно двигаться вперед в своем познании, если только не покидаем сферу опыта и не забываем, сколь многим этот опыт нам обязан. Отныне знание может быть и новым, и абсолютно истинным одновременно. А это ли не мечта всякого ученого?

Границы познания

Единственным ограничением, которое остается на пути триумфального шествия познания, — это безуспешные попытки выйти за пределы опыта и решить те задачи, которые «лежат по ту сторону всякого возможного опыта». В отличие от науки, для самой метафизики у Канта нет хороших новостей. Решение проблем, которые связаны с устройством самого познавательного аппарата или, если угодно, с попыткой не просто описать, а объяснить их устройство, обречено на провал. Но именно к этому обычно и тяготела метафизика. Между тем можно только применять наши способности к внешним впечатлениям, но нельзя применять их к самим себе. В противном случае рассудок будет запутываться и получать одинаково правдоподобные, хоть и противоположные, ответы на один и тот же вопрос — так называемые антиномии.

Проблемы, которые решала традиционная метафизика до того, как Кант указал на ее границы, по сути и являлись попытками постичь априорное с помощью самого априорного. Разум чувствовал, что владеет чем-то загадочным, но приписывал его миру философских истин, а не самому себе. Фактически же решая так называемые вечные вопросы философии, он спонтанно занимался собственной инвентаризацией. Четыре ключевых вопроса, которые метафизика пыталась решить с помощью рационально-логических средств, были, по-видимому, пустой тратой времени. Вопросы 1) возникновения мира, 2) делимости материи, 3) свободы воли или тотального детерминизма и 4) существования Бога нельзя решить при помощи теоретического разума. К некоторым из них может подступиться разве что практический разум — инстанция морального закона и нравственного чувства, присущих каждому из нас. Но этим должна заниматься другая, вторая «Критика» — «Критика практического разума», и это уже совсем другая история.

Глубокая нейронная сеть представляет собой сложную программу, состоящую из большого количества внутренних (скрытых) слоев с настраиваемыми параметрами — весовыми коэффициентами искусственных нейронов, составляющих каждый слой сети. На первый, входной слой сеть принимает вектор признаков, описывающих объект — данные в виде сигналов. На внутренних слоях происходит их обработка: входной вектор умножается на матрицу связей, и сформированный таким образом вектор новых признаков передается в следующий слой. Результат обработки сигнала отправляется на выходной слой сети.

Каждая нейросеть содержит множество параметров, которые невозможно настроить вручную, и поэтому мы обучаем нейросеть на массиве данных: в процессе обучения и переобучения весовые коэффициенты нейронов непрерывно меняются и настраиваются так, что результат вычислений и обработки сигналов становится осмысленным. Настройка весовых коэффициентов производится при помощи простого алгоритма оптимизации, основанного на методе градиентного спуска, используя который можно проследить, как меняется результат обработки сигналов нейросетью при небольшом изменении каждого ее весового коэффициента. Настройка весов происходит в каждом слое нейросети — именно поэтому ее и называют глубокой.

Чем сложнее устроена нейросеть, то есть чем больше слоев и нейронов она имеет и чем больше вычислительных операций она выполняет, тем, как правило, лучший результат она выдает, но и тем труднее нам понять, что происходит в ее внутренних слоях. Но последнее время мы стали лучше разбираться в том, как выполняются операции в скрытых слоях нейронной сети, благодаря появлению новых алгоритмов, помогающих визуализировать все процессы внутри нее.

Методы обучения нейронной сети

Перед тем как начать обучать нейросеть, чтобы с ее помощью решить новую задачу, которой до того никто не занимался, необходимо собрать и подготовить обучающую выборку, и обычно на это уходит бо?льшая часть времени.

В области компьютерного зрения большинство задач уже известны, и почти для любой из них существует обучающая выборка, с которой можно начать работу с нейросетью. Но чтобы решить задачу более эффективно, приходится собирать новые данные (картинки, видео и так далее) и либо размечать их, либо оставлять для нейросети определенные подсказки, как ей эти данные обрабатывать.

Важно собрать большой массив данных, поскольку, даже имея нейросеть с простой архитектурой, вы получите лучший результат, чем если бы ту же задачу решала нейросеть со сложной архитектурой, но обучаясь на выборке меньшего размера. Однако сейчас на первый план выдвигается обучение на смешанных наборах данных, например когда сеть обучается на двух наборах данных, один из которых большой и разнообразный, но либо имеющий ошибки в разметке данных, либо вообще неразмеченный, а другой набор данных правильно обработан и размечен, но маленький и недостаточно разнообразный. В таком случае необходимо придумать новый, нестандартный алгоритм, с помощью которого можно будет обучать нейросеть по обеим таким выборкам одновременно.

Среди парадигм обучения искусственных нейронных сетей различают алгоритмы обучения с учителем и без учителя. Первый предполагает наличие обучающей выборки данных, которая состоит из пар входных и целевых векторов (то есть известны условия задачи и само решение) и которую предъявляют нейронной сети. Каждый обучающий пример подается на вход сети, далее во внутренних слоях происходит его обработка, вычисляется выходной сигнал сети, и он сравнивается со значением целевого вектора — ожидаемым результатом. На основе этого вычисляется сигнал ошибки, который учитывается при дальнейшей перенастройке весовых коэффициентов нейронов сети. Процесс такой корректировки весов происходит до тех пор, пока значение ошибки по всему множеству входных векторов обучающего массива не станет минимальным на отложенном (валидационном) наборе данных. Благодаря этому сеть учится.повторять разметку данных, сделанную учителем, и, как следствие, делать разумные предсказания для новых данных.

Обучение без учителя происходит тогда, когда известны только входные векторы, на основе которых нейронная сеть учится искать в этих данных какие-то закономерности и давать лучший результат — значение выходного сигнала. Какие именно векторы будут сформированы на выходе, зависит от конкретного типа обучения без учителя.

Работа с нейросетью организуется наиболее эффективно, если обучение без учителя свести к обучению с учителем. Очень много прорывов последних пяти лет в этом направлении связано с использованием именно такой схемы, суть которой заключается в следующем. Мы отдаем нейросети поврежденные данные — это могут быть фразы, в которых отсутствует слово или его части, и тогда нейросеть пытается восстановить эти пробелы. Или показываем нейросети черно-белые фотографии, и она должна восстановить их цвет. Перед тем как поставить нейросети подобную задачу и запустить обучение, нам не нужно размечать данные, определяя, какой итоговый результат должен быть: у нас уже есть в огромном количестве подобные картинки, которые можно скачать из интернета. Но с точки зрения самой нейросети такое обучение похоже на обучение с учителем, поскольку на вход дается черно-белая картинка или фраза с закрытым словом и ей нужно восстановить данные известным на момент обучения образом.

Промежуточным звеном между обучением с учителем, когда после каждого шага нейросети эксперт указывает ей, ошиблась ли она или выдала правильный результат, и обучением без учителя, при котором нейросети не приходит из внешней среды никаких явных подсказок, является обучение с подкреплением. Оно помогает научить нейросеть не предсказывать нужные значения, а вести себя определенным образом, например создавать тексты определенного жанра. Это очень похоже на то, как учится человек: нейросеть, учитывая собственный опыт и последствия тех или иных собственных действий, меняет модель принятия решений.

Удобнее всего прибегать к обучению с учителем, но только когда есть хороший источник размеченных данных либо когда мы можем необходимые данные собрать и разметить. Но обычно ситуация такова, что объем выборки слишком велик и потому данные сложнее подготовить. Тогда проводится обучение без учителя, а затем нейросеть доучивается на небольшом размеченном наборе данных. В связи с этим можно вспомнить один из методов в машинном обучении — это перенос данных, когда нейросеть, обученную решать конкретную задачу, переключают на новую задачу, имея ограниченное количество новых данных. Допустим, нейросеть научилась распознавать породы собак, а теперь мы хотим, чтобы она разбиралась и в породах кошек. И поскольку собаки и кошки чем-то похожи, например шерстью, то опыт, который нейросеть получила, когда научилась распознавать собак, можно использовать при решении этой новой задачи.

Однако здесь мы сталкиваемся с принципиальным ограничением, которое исследователи еще не преодолели. Дело в том, что, хотя за последнее время нейросети сильно выросли по вычислительным мощностям и объему настраиваемых параметров, алгоритмы позволяют переносить данные только между похожими задачами. В рамках компьютерного зрения создаются нейросети, которые учатся решать одновременно все большее количество разнообразных задач, но в конце концов любой нейросети в какой-то момент перестает хватать вычислительных ресурсов, и эффективность ее работы на каждой конкретной задаче начинает падать. Скорее всего, это говорит о несовершенстве существующих алгоритмов, и пока нейронные сети уступают человеческому мозгу в способности переносить данные при решении разных задач.

Возможности нейросетей

Есть задачи, которые нейросети решают на том же уровне, что и человек, и даже лучше: например, они распознают хорошо освещенные, хорошо сфотографированные лица, точнее предсказывают структуру белка, обыгрывают людей в шахматы и го. Уже сейчас им поручено отсматривать камеры видеонаблюдения и реагировать на ситуации, влекущие за собой опасность для человека.

Но нейросети пока хуже, чем люди, оценивают степень точности собственных предсказаний, и если человек может признать свою неуверенность в чем-либо, то нейросеть никогда такого не скажет. Допустим, если мы покажем нейросети, обученной решать задачу распознавания пород кошек, овцу, то она уверенно отнесет ее к какой-нибудь породе кошек. Отсюда вытекает следующая проблема: если в разметке данных допущены ошибки, то нейросеть их просто не задумываясь выучит.

Но все-таки наибольшая эффективность в решении большинства задач достигается благодаря сотрудничеству человека и нейросети, которые дополняют друг друга. Например, лучшими игроками в го или шахматы являются «кентавры» — команды, состоящие из нейросети и человека; хотя последнее время, возможно, некоторые нейросети получают уже меньше преимуществ от партнерства с человеком. Однако игра в шахматы или го — это искусственно созданная ситуация, а в реальном мире с тем, что связано с пониманием нужд других людей и подразумевает common sense («здравый смысл»), человек справляется гораздо лучше нейросетей.

Компьютерное зрение

Почти все задачи компьютерного зрения лучше всего решаются при помощи сверточных нейросетей, которые являются универсальной, гибкой архитектурой, обрабатывающей разные типы сигналов: одномерные (голос), двухмерные (изображение), трехмерные (3D-объекты). Особенностью таких сетей являются слои свертки, в которых информация, поступающая от предыдущего слоя, обрабатывается локально, по фрагментам. Параметры слоев сверток (так называемые ядра) определяются самой нейросетью уже в процессе обучения.

Вычисления активации каждого следующего слоя бывают двух основных типов. Прежде всего, это собственно свертка — вычисление линейной комбинации активаций нейронов предыдущего слоя, благодаря которому формируется карта признаков, которая показывает наличие конкретного признака в обрабатываемом слое. Каждая свертка создает новое описание объекта (поэтому на выходе сети мы имеем массив изображений). После этого происходят вычисления в слое пулинга — изображение становится в несколько раз меньше, поскольку активация расположенных рядом друг с другом нейронов заменяется на их максимум или среднее значение. Слои свертки и пулинга чередуются друг с другом, и таким образом два этих типа вычислений происходят попеременно. Результатом обработки данных сверточной сетью является изображение минимального размера, но большой размерности, в котором закодирована вся интересующая нас информация об объектах на снимке.

Применение сверточных сетей в компьютерном зрении позволяет извлекать из изображений полезную информацию и создавать распознающие алгоритмы, а также анализировать собираемые данные. Это в том числе важно в распознавании и обработке биомедицинских изображений (например, снимков, полученных магнитно-резонансным томографом) для более точной диагностики заболеваний.

Нейросети широко используются в задачах навигации беспилотного транспорта. Основная проблема, с которой мы здесь сталкиваемся, связана с повышением уровня надежности и безопасности работы беспилотников. Пока он не выше, чем у человека, и повысить его средствами только лишь машинного обучения, как оказалось, очень сложно, и поэтому общество пока не согласно принять беспилотные автомобили.

Возможно, главная сложность связана с построением модели поведения людей — пешеходов, водителей, — чтобы у беспилотника была возможность предсказывать действия других участников движения. Беспилотные автомобили оснащены различными системами распознавания, например, дорожных знаков и автопилотирования, благодаря которым получают определенный набор информации об окружающем мире, расположении и движении объектов, и на основе этого корректируют свое движение: скорость, траекторию и так далее. Тем не менее это не уберегает их от ошибок.

Известна история, когда Tesla ехала по дороге, собирая с камер информацию об окружающей среде, и на полной скорости врезалась в белый грузовик, перегородивший путь. Оказалось, что система распознавания никогда не получала подобного обучающего примера, приняла белый трейлер за ярко освещенное облако и потому не стала тормозить. При этом и сам водитель грузовика допустил ошибку, нарушив правила, рассчитывая, что автомобили на главной дороге остановятся (в такой ситуации человек бы быстро все проанализировал и среагировал правильным образом).

Как избежать подобных аварий — сложный вопрос. Есть экстенсивный путь решения проблемы — показывать нейросети очень много примеров ситуаций, когда люди нарушают правила дорожного движения. Допустим, мы построим фотореалистичный мир, симуляцию, которая будет генерировать такие примеры сама или получать их извне — скажем, от компаний, занимающихся разработкой и тестированием систем автономного вождения. Однако все равно остается вероятность того, что какое-то сочетание факторов, которое может привести к аварии, мы не учтем и не отдадим нейросети на изучение.

Синтез изображений и мультипликация

Не так давно стало известно, что нейросети могут не только распознавать, но и синтезировать изображения — это делать нейросетям сложнее, поскольку, чтобы генерировать новые изображения лиц, компьютер должен лучше понимать, что такое лицо, чем при решении обычной задачи распознавания. Первые работы в этой области появились в начале 2010-х годов — в частности, в 2014 году была опубликована статья Алексея Досовицкого, посвященная синтезу изображений стульев (очень разнообразного класса объектов). Это вызвало большой интерес у исследователей, и методы нейросетевого синтеза изображений стали активно развиваться.Сейчас разрабатывается большой класс алгоритмов, включающих как элементы классических методов компьютерной графики, не связанных с машинным обучением, так и собственно глубокое обучение, и они дают новые интересные результаты.

Одним из применений подобных нейросетей, синтезирующих изображения, будут системы телеприсутствия, с помощью которых люди смогут общаться на расстоянии, видя трехмерное изображение друг друга, используя для того различные технические средства: трехмерные мониторы, очки виртуальной и дополненной реальности и так далее. Вопрос состоит в том, как рисовать аватары людей с максимальной реалистичностью: внешность, мимику, движения, жестикуляцию, чтобы сохранить невербальную часть общения, благодаря которой разговор становится интереснее и создается эффект присутствия. Чтобы решить эту задачу, мы должны обучить нейросеть на огромном массиве видеозаписей, а также фотографий людей.

Перспективной сферой применения нейросетей является мультипликация и кинематограф. Сейчас нейросети могут генерировать мультфильмы по текстовому описанию, пусть и допуская ошибки, но тем не менее облегчая работу мультипликаторам, и писать музыку к фильмам и даже сценарии. Кроме того, они удешевляют и упрощают процесс создания визуальных спецэффектов в фильмах там, где обычно используется традиционная компьютерная графика.

Машинный перевод

Задача машинного перевода сводится к работе с последовательностями: у нас есть некоторая входная последовательность слов на одном языке, например фраза или целый абзац, и нам нужно получить ту же последовательность слов на другом языке. Одна фраза, как правило, включает не более ста слов, что гораздо меньше, чем содержится пикселей в одной картинке. Но при этом каждый ее элемент гораздо сложнее, чем пиксель, — большинство алгоритмов работает на уровне слов, где слово приходит из словаря большого размера.

В подобных ситуациях лучше всего работает трансформер — архитектура, которая появилась в середине 2010-х годов и уже получила наилучшие результаты в анализе текстов и машинном переводе. Суть работы нейросети-трансформера заключается в том, что каждый элемент текста по отдельности обрабатывается и записывается как вектор, сохраняя свое положение в последовательности. На каждой стадии обработки включается так называемый механизм внимания: при обновлении вектора, описывающего конкретное слово, трансформер фокусируется на некоторых словах фразы, причем степень фокусировки (внимания) предсказывается самим трансформером исходя из векторов-представлений, подсчитанных на предыдущих шагах. Векторы слов, на которых трансформер обратил внимание, складываются друг с другом, умножаются на матрицу, и получившийся вектор (так называемый вектор контекста) используется для обновления представления нашего слова. Обновления представлений для разных слов происходят не последовательно, как в рекуррентных сетях, а параллельно. 

Несмотря на преимущества трансформера перед другими нейросетями, например рекуррентными и сверточными, нейросети сложно создать качественный художественный перевод, поскольку она пока не улавливает тонкости, что составляют суть такого перевода. И лучше всего нейросеть делает перевод юридической литературы и похожих типов текста, где легко можно собрать обучающие данные и распространены шаблонные речевые обороты.


Источник: postnauka.ru

Комментарии: