ФЭНДОМ


Модель функционального разделения сознания и бессознательногоПравить

(на базе экспериментов с искусственными нейронными сетями) (© Сергей Яковлев, 2006-2007)

Введение Править

Изложение данного материала требует от читателя понимания таких терминов как ассоциации, распределенность, линейность, объектная модель, перцептрон. Это затрагивает в первую очередь такие разделы наук как искусственные нейронные сети, объектно-ориентированную парадигму проектирования и программирования, некоторые разделы математики, а также частично нейрофизиологию.

Но несмотря на такое количество требуемых знаний, материал изложен в популярной форме, требующий лишь минимального понятийного базиса, но при этом наличие указанных знаний позволит глубже понять и вникнуть в описываемую проблематику.

Модель памяти Править

Вначале читателю нужно отказаться от того мнения, что память человека, сходна с компьютерной, т.е. то что записывается, то потом можно считать в неизменном виде. И кроме того, что запись в памяти имеет четко локализованное место. Это все далеко не так ! Итак, первое, распределенность – основная характеристика памяти. Имеет ряд следствий:

  1. Память не статична, она динамична. Конкретный факт распределен в памяти и постоянно меняет места;
  2. Так как факт не имеет точно локализованного места, то такая память более надежна (и не обязательно избыточна). Потеря какого-либо элемента памяти ухудшает лишь качество запомненных фактов, но не приводит к полной потери факта.

Вторая характеристика – ассоциативность. Рассмотрим вначале вырожденные случаи, когда модель памяти имеет одну характеристику, но не имеет другой:

  1. Распределенная, но не ассоциативная память. Известна в программировании как распределенная база данных.
  2. Не распределенная ассоциативная память. Известна как прямой (или обратный) логический вывод, используемый в экспертных системах.

Что же добавляет ассоциативность к свойствам распределенности:

  1. Объединяет распределенные элементы в единое целое;
  2. Позволяет объединить распределенные элементы в такой комбинации, которая ранее не была предусмотрена;
  3. Новые комбинации могут объединяться в ответ на ранее неизвестный стимул, т.е. как бы предугадывая ответ (прогнозирование).

Таким образом, распределенность является необходимым условием, а ассоциативность достаточным условием для возникновения эффекта предвидения (прогнозирования).

Эффект предвидения можно считать проявлением интуиции. Он считается необходимой частью интеллектуальной деятельности. И относиться скорее к проявлению бессознательного, чем сознания.

Осознанное прогнозирование имеет другие проявления – оно не может быть основано на распределенности и ассоциативности. Оно имеет детерминированный характер и конкретную направленность. Такое прогнозирование основано на четких аналитических формулах.

Здесь же мы далее будем говорить о бессознательном прогнозировании, которое является одним из эффектов возникающих в распределенной и ассоциативной памяти.

Мозг человека способен осознать только простые линейные закономерности. Мы не когда не работаем со сложными системами, мы раскладываем их на простые системы и отдельно рассматриваем отношения между этими простыми системами. Весь объектно-ориентированный анализ построен на этом принципе.

Мы не способны оперировать характеристиками, которые в сложных комбинациях дают один тип явлений, а в других сложных комбинациях дают другой тип явлений. Мы можем рассуждать лишь в терминах – если присутствует эта и эта характеристика, то явление такое-то. В реальности же такой простоты не существует, если бы мы не смогли бы найти механизм абстрагирования от сложности нам пришлось бы рассуждать так – если есть эта и эта характеристика, и отсутствует эта и эта, то в данном конкретном случае это такой-то тип явления. Но такое рассуждение не может быть обобщенно, а это означает, что теряется любая надежда на прогнозирование.

Но память человека и здесь постаралась, и предъявила нам принцип двухслойности – третья характеристика памяти. Это означает, что мозг не воспринимает первичные стимулы (сигналы) из внешнего мира. Он отображает эти стимулы на поле своих элементов памяти. В результате этого отображения изначальные нелинейные стимулы преобразуются совсем в другой набор уже линейных стимулов.

Для возможности выполнения принципа двухслойности необходимо реализовать в модели памяти нелинейную функцию отображения. Для чего становиться ясно из следующей математического принципа*: Принцип отображения нелинейности в линейность. Любое нелинейное множество характеристик отраженное с помощью любой нелинейной функции на множество большее по объему на одну размерность (т.е. если объем исходного множества 256, то объем конечного множества 2562) линейно разделимо. Итак, в чем же проявляется эта третья характеристика памяти – двухслойность:

  1. Мы уже упоминали, возможность абстрагирования от сложности;
  2. К сожалению, эта характеристика проявляет себя отрицательно. Необходим больший на порядок объем памяти, чем воспринимаемый мир стимулов. Правда это объем более простого устройства, чем те взаимоотношения между входными стимулами среды. Точнее элементы памяти непосредственно не связанны между собой, между ними нет взаимоотношений, поэтому сами по себе они просты. Именно их объем позволяет разложить сложные взаимоотношения между воспринимаемыми стимулами;
  3. Благодаря этой характеристики, мы смотрим на мир в “розовых очках”. Мы не видим его непосредственной сложности, мы не видим того хаоса, который здесь присутствует – весь хаос уже убран и предстает перед нами уже как осознанный миропорядок. Многие захотели бы снять эти “очки”, увидеть жизнь во всей ее сложности, но эту функцию взял за нас наш организм – он занимается всеми частностями – сколько таких-то и таких-то веществ нам нужно, это и есть функция бессознательного и инстинктов. И если мы вынесем это на уровень сознания (хоть это и не возможно) мы деградируем, и не только потому, что у нас не будет времени на творчество, а потому что мы не сможем возвыситься над частностями, сложность не позволит нам видеть дальше. Но зато мы вынуждены видеть мир искаженным, т.е. правильным как он пред нами предстает;
  4. Нет принципиальной разницы как связаны между собой элементы регистрирующие стимулы с элементами памяти. Любое случайное связывание представляет собой нелинейную функцию отображения. Важно лишь двухнаправленность – возбуждающие и тормозящие связи. Они играют роль баланса, уравновешивающего две различные крайности.

Как видите эта третья характеристика памяти более технична. Возможно в реальности она другая более естественна. Но заменить ее чем-то очень непросто. Пока же вынуждены мириться с этой техничностью, т.к. она просто осуществляет предыдущие характеристики – распределенности и ассоциативности.

Модель обучения (условный рефлекс) Править

При обучении происходит запись на распределенную память. Этот процесс записи сильно отличается от мгновенной записи в локализованное место памяти, как это имеет место быть при записи информации на диск компьютера. Заранее не известно в какие элементы нужно записать различные части записываемого факта. Неизвестно даже как нужно этот факт поделить.

С одной стороны, принято говорить, что стимул (факт) вызывает определенную активность в элементах памяти. Это следствие реакции, которая появляется как внешнее проявление процесса перехода от нелинейности к линейности. С другой стороны, при обучении заранее известно какой реакции ждут от возникновения определенного стимула. Другими словами, при обучении указывается какому типу явлений (классу) принадлежит данный факт (стимул).

Таким образом, соотнесение активности памяти с получаемыми указаниями является сутью обучения.

Возникаемая активность памяти (псевдослучайно, т.к. подчиняется все-таки определенному закону формирования, но для конкретного стимула выбирается случайно) указывает на каких элементах нужно записать факт – на активных элементах памяти.

Далее остается вопрос как распределить информацию о факте? Математически это вопрос решения системы уравнений – большого числа уравнений, которые требуется между собой согласовать. При этом наиболее оптимальным алгоритмом решения системы уравнений является алгоритм обучения используемый в перцептроне Розенблатта (или других сходных искусственных нейронных сетях перцептронного типа).

Другой важный момент в теории обучения, состоит в способности вырабатывать свое мнение на основе обучения от нескольких разных учителей. Аппроксимация, нахождение среднего между мнениями разных учителей еще нельзя назвать выработкой своего мнения. Свое мнение появляется когда за основу выбирается некоторое общее положение, которое в принципе объединяет два или более мнения учителей хотя бы в ограниченной области. Т.е. происходит подменна стимулов инициированных учителями на собственные стимулы, которые и берутся за основу. Если удается при этом обучиться и получить результат сходный с результатом учителей, то можно говорить о выработке своего мнения. При этом при обучении могут выявится противоречия, которые имеются в картине предлагаемой одним и тем же учителем. Это указывает на то, что по мнению обучаемого картина предлагаемая учителем не точна, и здесь может применяться аппроксимация, но не между мнениями разных подходов (учителей), а между одним и тем же подходом, но в разных ситуациях. Т.е. по мнению обучаемого учитель поступает по разному в одинаковых ситуациях, но только не видит, что ситуации разные. Такой эффект происходит из-за того, что обучаемый изначально выбрал несколько другие основные положения, и при обучении подменял стимулы учителя своими. Описанный процесс обучения полезен как формирование новых знаний, появление различных углов зрения на один и тот же процесс … и главное, такое обучение может быть промоделировано и автоматизировано.

Модель проявления сознания Править

Что же является сознанием в узком смысле?

Определенно все то, чему обучили нас непосредственно, весь тот опыт, который мы непосредственно получили. И та степень бессознательного, которую мы допустили в сознание.

Вот этот механизм, допускающий бессознательное в сознание, является “камнем преткновения” многих философий. И именно этот механизм мы раскроем читателю, т.к. автору получилось воссоздать (промоделировать) его виртуально (естественно, лишь в лабораторных условиях).

Первое, определимся с тем, что такое бессознательное. Это на самом деле проще, чем может показаться первоначально. Бессознательное – это весь механизм памяти и те эффекты, которые там возникают. Этому, в частности, были посвящены предыдущие два раздела. Вся та распределенность, ассоциативность, двухуровневость никогда не были сознательны, все эти эффекты внутренние. А на поверхность допускается лишь конечный результат (элементы реакции) под воздействием сознательного комплекса.

Второе, довольно важное положение, это описание сознательного комплекса. Чем он отличается от всего бессознательного, от прочей работы памяти?

Комплекс, согласно Юнгу, образуется когда бессознательная область психики приводится в движение. Процессы, происходящие в бессознательном, могут в чем-то противоречить друг другу. Тогда эти процессы выносятся на уровень сознания. Сознание может лишить энергии, которую следовало бы направить на разрешение этого комплекса. Если это происходит, то возникает т.н. “понижение умственного уровня”. Интенсивность сознательных интересов и деятельности постепенно убывает, из-за чего возникает либо апатичная инертность, либо регрессивное развитие сознательных функций, под этим понимается опускание последних на их инфантильные и архаичные первоступени, т.е. нечто вроде дегенерации. Но сознание может отождествить себя с данным комплексом. Тогда наличие таких комплексов становиться одним из нормальных свойств психики. Эти сознательные комплексы проявляются в сколько-нибудь дифференцированной типовой установке или потребности.

Именно такой сознательный комплекс возникает в процессе обучения. Любое обучение – это декларация противоречивых для бессознательного вещей. Этот комплекс устанавливает определенную активность, ответственную за принадлежность внешних стимулов к определенному типу явлений. Сама эта активность возникает как бы изнутри, как борьба сознания с противоречивостью бессознательного. Этим она отличается от другой активности, которая возникает в бессознательном в ответ на стимулы внешней среды.

Работа такого сознательного комплекса серьезно ускоряет процесс обучения. Это происходит от того, что комплекс сам дифференцирует различные типы явлений, а при обучении остается согласовать это с другой возникающей активностью бессознательного. Это намного проще, чем полностью согласовывать достаточно противоречивую активность бессознательного.

Далее весь вопрос в степени захваченности обучения сознанием. Если обучение произошло быстро – это показывает высокую степень осознанности. Теперь когда происходит проверка способности, обучение которой произошло, важным становиться объем полученного обучения. Если он крайне мал (по сравнению с общим объемом области знаний), то все равно включается бессознательное, и пытается хоть как-то заменить работу сознанию, обобщая как можно полученные знания, с целью предвидеть реальность. К сожалению, бессознательному в этом случае практически нечего обобщать и получается лишь некая нелепица.

Если же объем полученных знаний более высок, он вытесняет бессознательные процессы. И сознание восстанавливает ранее полученные знания, а бессознательное допускает лишь для небольшого минимального обобщения знаний. Но для всех тех областей, которые не были непосредственно заученны, в результате просто не возможно сделать ни какого предположения, и тем более предвиденья их значений.

Интуиция работает удовлетворительно лишь тогда, когда процесс обучения не был полностью захвачен сознанием, а происходила некая отвлеченность. Эта отвлеченность или последующая забывчивость не должны быть слишком большими, ориентировочно должно оставаться 80% внимания. При этом процесс обучения немного затягивается – это позволяет включиться в обучение бессознательному.

Когда же позже происходит проверка способности (при достаточном объеме полученных знаний), работа сознания позволяет очертить четкие границы знаний, а работа бессознательного наполнить содержанием те места, обучению которым не уделялось внимания, т.е. происходит некое обобщение, предвиденье (прогнозирование).

В отдельности работа бессознательного в этом случае представляет некое “размытое пятно”, при наложении на которое работы сознания, получается достоверные знания.

Но иногда процесс обучения может не сопровождаться присутствием сознания. При этом позже будет получено достаточно удовлетворительный результат, но зато никогда не возможно будет достичь четкости. Знания будут постоянно размыты.

Модель «Нулевого сознания» в Интеллектронике Править

«Комплекс устанавливает определенную активность, ответственную за принадлежность внешних стимулов к определенному типу явлений. Сама эта активность возникает как бы изнутри, как борьба сознания с противоречивостью бессознательного.»

Эта фраза для практика – кибернетика сильно расплывчата и мало указывает какой особенностью должна обладать модель сознания. Здесь мы постараемся объяснить эту мысль более конкретно.

За основу модели берется модель памяти – перцептрон Розенблатта. В перцептроне известна проблема забываемости. Она проявляется так: при обучении каждый последующий стимул может затереть память, а точнее изменить весовые коэффициенты, на которых базировалась реакция при предыдущем стимуле. Поэтому за один проход (итерацию) при котором единожды показываются стимулы из обучающей выборки, даже если на конкретный стимул уже была получена правильная реакция, последующие обучение может привести к забыванию. Поэтому обучение завершается только когда согласованы все пары стимул-реакция по всей обучающей выборке, которые периодически забываются.

Это и понятно, т.к. это соответствует нахождению коэффициентов в системе уравнений. Если были найдены коэффициенты удовлетворяющие решению нескольких уравнений К из общего числа уравнений N в системе, то при последующем поиске коэффициентов, несмотря на то, что будут согласованы другие M уравнений, для некоторых из К будут опять не совпадать условия. Эта проблема является причиной длительного обучения.

Упростить, улучшить и тем самым получить более быстрое обучение можно применив описанный ниже прием. Этот прием по внешним результатам напоминает проявление сознания в бессознательном. Но не будем забегать вперед.

Можно было бы вообще не пользоваться моделью перцептрона, а просто запоминать соответствия вход-выход. Но тем самым мы лишились бы возможности делать некоторые обобщения и главное, у нас не было бы модели взаимосвязи интересующей нас предметной области, выраженной системой нелинейных уравнений.

Аналогичный этому результат можно было бы получить напрямую вмешиваясь в управление активацией элементов ассоциативного слоя (А-элементов). Что это дало бы?

Скажем, выделим для этих целей дополнительно столько А-элементов, сколько и R-элементов, т.е. увеличим размер памяти, не связывая ее с сенсорными элементами, на размер реагирующих элементов. А во время обучения, при подачи соответствующего стимула на сенсорные элементы, будем одновременно устанавливать активность этих дополнительных А-элементов. При этом эту активность будем устанавливать, так чтобы она в точности соответствовала требуемую состоянию R-элементов. Состояние же активности других А-элементов будет псевдослучайным, точнее каким-то образом будет зависеть от входного стимула.

В таком случае, обучение будет практически мгновенным, т.к. в памяти (ассоциативном слое) искусственно образуется такой паттерн, как и требуемый на выходе. Этим и воспользуется процедура обучения, цель которой будет лишь нейтрализовать случайную активность на других “обычных” А-элементах.

Следует отметить, что представленный здесь прием “ускоренного обучения” имеет существенный недостаток – такая модель практически исключает возможность обобщения и последующего прогнозирования на экзаменационном множестве. Это ставит под сомнение, в таком случае, вообще применение перцептрона.

Но это, естественно, вырожденный пример. Стоит лишь изменить некоторые детали и тогда такой прием “ускоренного обучения” будет обладать существенными преимуществами перед любой нейронной сетью по ряду параметров.

Такие детали состоят в следующем. Необходимо ввести некоторый элемент случайности (мутирования) в активацию дополнительных А-элементов, о которых говорилось выше. Например, при необходимости активировать дополнительный А-элемент мы будем в 80% (эту цифру назовем фактором внимания) случаев реально его активировать. Это несколько замедлит обучение, т.к. сенсорную активность уже будет не так просто нейтрализовать. А так как во внутренней активности будет потерянна 100% достоверность необходимой на выходе реакции, то процедуре настройки коэффициентов (обучению) потребуется учитывать и сенсорную информацию и согласовывать ее с внутренней. Этот процесс можно образно, или просто в более узком, частном проявлении – назвать проявлением сознательного из бессознательного.

Самое важное, что применяя эту модель “за плечами” остается проблема забывания и в такой нейронной сети (в отличии от других) не возникает ситуаций, что она прогнозирует хуже, чем была обучена. Такая сеть позволяет регулировать (посредством фактора внимания) уровень обобщения – в одном крайнем случае получать учет всей обучающей выборки, но практически с отсутствием возможности прогнозирования; в другом крайнем случае, получаем результат аналогичный результату перцептрона, когда обобщение настолько велико, что образ становиться сильно размытым и уже нельзя понять какие черты образа правдоподобны (соответствуют обучению); меняя же фактор внимания можно плавно регулировать уровень обобщения получив дополнительно к известным чертам образа наиболее вероятное обобщение. Более того скорость обучения становиться прогнозируемой и зависит от фактора внимания.

Стоит упомянуть, что в некоторых известных нейронных сетях уже и ранее были, на взгляд автора, не вполне осознано использованы некоторые принципы представленные здесь.

Так, например, метод СС4 S. Kak, использует идеи угловой классификации, и пытается максимально ускорить обучение посредством статического расчета активности внутреннего слоя, искусственно активируя лишь один А-элемент для разных стимулов. Это сходно с тем, что мы непосредственно воздействуем на активность А-слоя, но отличается тем, что мы более точно ставим соответствие активности А-слоя с необходимым результатом на R-слой. А также плавность обобщения при угловой классификации (которая осуществляется уже другим способом, чем у нас) оставляет желать лучшего.

Так же стохастические сети Амосова, в которых, также на взгляд автора, необоснованно большое внимание уделяется вопросу случайности активации ассоциативного слоя имеют некоторую аналогию в нашем подходе. Имеется ввиду принцип случайности активации дополнительных А-элементов в зависимости от величины фактора внимания, но в отличии от сетей Амосова, остальные А-элементы при активации не подвержены такой случайности.

Именно цельность нашего подхода позволяет говорить о, пускай и отдаленной, но аналогии с информационными процессами возникающими при проявлении сознания у человека. В конце концов, наша модель сознания имеет такое же отношение к человеческому сознанию, как и модель искусственного нейрона к нейрону биологическому.

Напоследок, стоит обратить внимание на то, что такая модель “нулевого сознания”, естественно, нуждается в усовершенствовании. И первым становиться вопрос об искусственности применяемого приема, ведь мы непосредственно как “с неба” регулируем дополнительные элементы в ассоциативном слое. Это, конечно же, противоречит реальному положению дел. И лишь пока мы с этим миримся, т.к. не знаем как заменить эту техничность более естественным процессом, при котором такая активация дополнительных А-элементов будет на чем-то основываться. Например, похоже на то, что она должна каким-то образом зависеть от сенсорных или полусенорных входов как проявление некоторых логико-сенсорных способностей.

Стоит заметить, что если моделируя память, исследуя информационные процессы мы могли обратиться за помощью к нейрофизиологу, то продолжая совершенствовать наши познания о информационно – интеллектуальной деятельности человека, моделируя сознание – мы вынуждены обращаться за помощью к психологам и психотерапевтам, несмотря на расплывчатость их понятий в этой области. Есть лишь надежда, что наше моделирование позволит внести большую ясность в психологические понятия, за которыми будут стоять информационные модели.

Обнаружено использование расширения AdBlock.


Викия — это свободный ресурс, который существует и развивается за счёт рекламы. Для блокирующих рекламу пользователей мы предоставляем модифицированную версию сайта.

Викия не будет доступна для последующих модификаций. Если вы желаете продолжать работать со страницей, то, пожалуйста, отключите расширение для блокировки рекламы.

Также на ФЭНДОМЕ

Случайная вики