6. Теоретико-информационные модели
Значительную часть описанных в литературе моделей итеративного научения составляют модели, основывающиеся на рассмотрении процессов переработки информации в обучаемых системах. Объединяет эти теоретико-информационные модели то, что, практически, во всех из них предполагается, что возможности обучаемой системы по передаче и переработке информации (количество информации, передаваемой, обрабатываемой, усваиваемой и т.д.
"... среднее время, требующееся для четкого уяснения значе-ния некоторого сигнала и правильной реакции на него, возрастает пропорционально средней информации, содержащейся в этом сигнале. Исходя отсюда, можно предположить, что в случае достаточно регулярно происходящих событий, характеризующихся определенной статистической устойчивостью, сообщение о воз-никновении такого события передается через органы чувств и центральную нервную систему в среднем за время, пропорциональное содержащейся в этом сообщении информации. ... передача сообщений в живом организме происходит так, что за одинаковое время в среднем передается одинаковое количество информации" [95, с. 115].
Частным случаем предположения об ограниченности возможностей человека при переработке информации является известный закон Хика, устанавливающий пропорциональность (в определенном диапазоне) между количеством обрабатываемой информации и неопределенностью сигнала; при превышении последней некоторого порогового значения количество перерабатываемой информации остается постоянной.
Различают два типа информации - связанная (начальная, априорная информация, заложенная в структуре системы) и свободная. Процесс научения при этом может интерпретироваться следующим образом: "... свободная информация постепенно переходит в связанную, происходит процесс "научения" - повышения первоначальной организации системы, наращивание объема связанной информации" [40, с. 15]. Обучение может также пониматься как "... развитие системы без увеличения элементного
состава, повышение ценности информации установлением дополнительных связей" [37, с. 193], причем модификация структуры целей в большинстве случаев вызывает лишь количественные, а не качественные изменения [47, 55].
Информация, поступающая на вход системы или ее подсистемы может использоваться, в частности, следующим образом:
непосредственная реакция;
запоминание предыдущих ситуаций с целью отбора наиболее удачных реакций непосредственного типа;
запоминание внешних воздействий с целью их экстраполяции и выявления рациональной реакции на экстраполированное внешнее воздействие;
И, наконец, наиболее общий четвертый случай - создание моделей внешнего мира и получение прогноза на базе функциониро-вания моделей [51].
Практически все рассматриваемые в настоящем разделе моде-ли итеративного научения опираются на приведенные выше положения.
Модель 6.1. (Ю.Г. Антомонов [10]).
О. В работе [82] был предложен подход к определению понятия организации системы и ее сложности [44] через энтропию. Соответствие между сложностью и организацией системы и сложностью и организацией окружающей среды устанавливается принципом адекватности.
Известны различные формулировки принципа адекватности [7, 8, 41]. Например, возможности (сложность, пропускная способность и т.д.) управляющей системы определяют пределы "управляемости" объекта управления, как бы не были велики его собственные возможности (обратное соотношение встречается в биологии чрезвычайно редко). Другими словами, "для того, чтобы система успешно функционировала в среде, сложность и организация ее должны быть адекватны сложности и организации среды"
[9].
В [9] предложен принцип динамической адекватности : "... при изменении сложности и организации среды биосистема постоянно стремится достичь нового уровня адекватности по сложности и
организации со средой с минимизацией времени, затрат вещества и энергии".
Г. В частности, в [9] вводится следующее предположение (которое в том или ином виде используется, практически, во всех теоретико-информационных моделях ИН): изменение энтропии в обучаемой системе - (количество информации, перерабатываемой получаемой, передаваемой и т.д. системой) пропорционально изменению энтропии окружающей среды.
Ф(В, А). Коэффициент пропорциональности зависит от воз-можностей системы - пропускной способности каналов передачи информации, максимально допустимой скорости изменения параметров элементов и т.д., причем, если коэффициент пропорциональности и количество информации, поступающей в единицу времени, постоянны (не зависят от времени), то динамика системы, очевидно, описывается экспонентой (см. ниже более подробно). Если обучение рассматривается как процесс получения информации, то в обучаемой системе происходит поэтапное устранение неопределенности за счет информации, поступающей из внешней среды [30, 41, 54, 78]. •
Модель 6.2. (Ю.В. Рублев, Г.Н. Востров [74]).
О. Процесс переработки информации обучаемой системой.
Г. Предположим, что информационные потоки удовлетворяют уравнению
dI dJ п
— = а — + b J, dt dt
где I - количество поступающей информации, J - количество усваиваемой информации, а и Ь - константы, характеризующие обучаемую систему и определяющие скорость научения.
Уравнение (6.1) свидетельствует, что скорость усвоения ин-формации пропорциональна скорости поступления информации и уменьшается (также пропорционально) с ростом уже полученной информации.
Предположим, что количество информации, поступающей в единицу времени постоянно:
I(t) = в t.
Ф(В). Решение (6.1) в рамках сделанного предположения имеет вид
J(t) = 8 (1 - e- gt) где
8 = в/$ g = b/ a.
А. Предположения о постоянстве (или ограниченности) количества информации, поступающей или перерабатываемой обучаемой системой в единицу времени, используются практически во всех теоретико-информационных моделях итеративного научения, причем в большинстве из них они имеют именно вид (6.2). В рассматриваемой модели для получения выражения (6.3) потребовалось введение достаточно конкретной гипотезы о связи поступающей и усваиваемой информации. Интересно отметить, что скорость обучения, определяемая константами a и не зависит от темпа поступления информации в - внешнего параметра, а определяется только параметрами самой системы. •
Модель 6.3. (В.Ф. Присняков, Л.М. Приснякова [69, 70, 83]). О. Запоминание и хранение информации в памяти человека. Г. Информационные потоки подчиняются соотношению
dJ dI ? (6 5) ~Г = "7 - (J - J? / T, dt dt
где J - количество усваиваемой информации, — - темп усвоения
dt
dI
информации, — - темп подачи информации, T - постоянная dt
времени (характерное время, определяющее скорость научения) процесса переработки информации памятью человека, J - предельное значение усвоенной информации (ср. с (6.1)).
dI
Ф(В, А). В предположении — = в = Const (постоянство
dt
внешних условий), решение (6.5) имеет вид
(6.6) I(t) = 8 (1 - e - gt),
где 8 = I? + в T, g = 1 / T (ср. с (6.3)). •
Модель 6.4. (О Ф. Шленский, Б.В. Бодэ [90]). О. Процесс накопления информации и ее забывания.
Г. При постоянном количестве информации, поступающей в единицу времени, "идеальная память" запоминает всю информацию. В реальной памяти количество запоминаемой в единицу времени информации убывает с ростом уже запомненной информации (замедленная асимптотичность). После окончания процесса обучения идеальная память сохраняет информацию неограниченно долго, а в реальной памяти количество информации после окончания процесса обучения монотонно убывает (забывание), причем текущая скорость забывания пропорциональна объему имеющейся на данный момент информации I(t) (замедленная асимптотичность, см. рисунок 6.1).
Рис. 6.1. Количество запомненной информации
Ф(В, А). Если "уравнение памяти" представить линейным ин-тегральным уравнением, то качественный вывод будет таким же, как и при использовании уравнений (6.1) и (6.5) в моделях 6.2 и 6.3 [90]. •
Модель 6.5. (В.А. Трапезников [76, 77]).
О. Переработка информации человеком-оператором.
Г(Ф, В, А). Экспоненциальная зависимость качества работы оператора в зависимости от времени обучения постулируется. •
Модель 6.6. (Г.П. Шибанов [89]).
Переработка информации оператором (в человеко- машинной системе) при обучении и в процессе профессиональной деятельности.
Г.
W(t) = Wo e -bt.
Предположим, что I(t) = a t, где t - время обучения оператора, a - константа, характеризующая систему подготовки. Определим качество работы оператора следующим образом
Q(t) = Qmax (1 - W(t)).
Ф(В). Тогда
Q(t) = Qmax (1 - Wo e- gt), где g = a
А. Экспоненциальный характер КН обусловлен выбором энтропии и информации как характеристик неупорядоченности, конкретными (в частности, линейными) зависимостями характеристик деятельности оператора от неупорядоченности и предположением линейного увеличения количества накопленной информации. В рассматриваемой модели скорость научения зависит как от темпа поступления информации в процессе обучения, так и от характерного времени изменения неупорядоченности.
Следует отметить, что в [89] выделялись три этапа обучения:
Первоначальная "приработка" человека-оператора к данному режиму работы.
"Отработка" результативных характеристик в рамках фиксированного режима (собственно этап итеративного научения).
Деятельность, характеризуемая статистически стабильными характеристиками.
Зависимость ошибки от времени можно в этом случае схематично представить кривой, приведенной на рисунке 6.2. •
Модель 6.7. (В.М. Глушков [33]).
О. Переработка информации в процессе обучения перцептро- на (системы распознавания образов, которая может рассматриваться как модель запоминания и научения в живых системах).
Г. Для правильного распознавания 7-го изображения необходимо и достаточно, чтобы оно было хоть раз показано перцептрону в процессе обучения.
Ф. При n случайных (равновероятных) показах изображений вероятность появления одного из N образцов составляет (1 - 1 /N)n @exp ( - n /N).
В. Тогда полная эффективность обучения (вероятность правильного распознавания в зависимости от длительности этапа научения)
Pn = 1 - Є - 7П.
где g = 1 / N.
А. Сравним с моделью 5.2. В данной модели, как и в 5.2, вероятность уменьшения рассогласования элементов (каждый элемент " отвечает" за запоминание одного образа) характеризуется постоянной вероятностью g "зануления" его рассогласования в единицу времени (вероятностью того, что соответствующий образ был показан и запомнен). Обучаемая система предполагается достаточно пассивной, поэтому скорость научения обратно пропорциональна числу возможных вариантов N. •
Модель 6.8.
О. Обучаемая система имеет канал связи, через который в процессе научения из внешней среды поступает информация, причем чем большая часть информации получена системой, тем меньше рассогласование.
Г. В канале связи, пропускная способность которого ограничена, присутствуют помехи [88]. На каждом шаге посылается вся информация, которая еще не получена системой, причем каждый раз система получает неискаженной лишь некоторую фиксированную ее часть.
Ф. Предположим, что для успешного научения система должна получить полную информацию I. На первом шаге посылается вся информация, неискаженной "доходит" gI (g< 1).
На втором шаге посылается информация в объеме (1 - g) I, из которой система получает g(1 - g) I и т.д. Количество информации, полученной системой через n > 2 шагов, определяется выражением
Jn = (1 + (1 - g) + (1 g)2 + ... + (1 - g)n-1) yl, то есть Jn = gI (1 - (1 - g)n).
Возможны и другие интерпретации. Пусть, например, на каждом шаге посылается вся информация I. Тогда количество полученной информации изменяется со временем следующим образом:
J(t+Dt) = J(t) + g (I - J(t)) Dt.
В. Решение (6.9) имеет вид
J(t) = I (1 - e- gt).
А. Такой вид решения обусловлен пропорциональностью количества новой информации, получаемой системой, тому количеству информации, которое осталось передать. Другими словами это свойство (предположение) можно интерпретировать следующим образом: способность системы усваивать (запоминать) ин-формацию уменьшается пропорционально количеству запомненной и переработанной информации.
Критическим при этом (для того, чтобы решение имело вид, совпадающий с (6.10)) является то, что пропорция между получаемой частью информации и уже накопленной остается постоянной во времени. Следует отметить, что в рамках данной модели просто предположение об ограниченности пропускной способности канала связи привело бы к совершенно другим выводам (количество 44
накопленной информации росло бы линейно и т.д.). Скорость научения в рассматриваемой модели определяется пропускной способностью канала g - чем большая часть информации доходит без искажений, тем выше скорость научения. •
Модель 6.9.
О. Представим сложную обучаемую систему в виде множества элементов (их число обозначим N), совместные действия которых ведут к достижению некоторой фиксированной цели.
Предположим, что каждый элемент характеризуется конечным множеством его допустимых состояний S7(t) (число элементов множества S7 равно n7(t)), в одном из которых он может находиться
в момент времени t, 7 = 1, n. Число независимых состояний системы в целом (описываемой перечислением состояний ее невзаимодействующих элементов) равно произведению числа допустимых состояний всех элементов.
Г. Предположим, что научение заключается в сведении числа допустимых состояний каждого элемента к некоторому минимуму, то есть в оставлении одного или нескольких фиксированных состояний, соответствующих решаемой задаче. Цель обучения для системы - минимизация числа ее допустимых состояний. Уменьшение числа допустимых состояний каждого элемента происходит по мере получения им информации.
Энтропия 7-го элемента (его неупорядоченность):
H(t) = ln n(t).
Количество управляющей информации X(t), поступившей 7-му элементу в момент времени t, идет на снижение неопределенности:
Hll = - X(t), t > 0.
at
Предположим, что существует абсолютный предел количества регулирующей информации, поступающей в каждый момент: ?7(t)< g7, " t > 0. В общем случае, в момент времени t, X(t) принадлежит отрезку [0; g] (X(t) ° 0 соответствует тому, что 7-ый элемент в момент t не обучается).
Ф. Исследуем, как будет изменяться со временем число допустимых состояний элементов. Подставляя (6.11) в (6.12) и решая соответствующее дифференциальное уравнение, получим
n (t) = n° exp ( - JХг (t)dt), i = 1, n, t > 0,
0
где n0 - число допустимых состояний i-го элемента до начала
научения. Интеграл в показателе экспоненты соответствует накоп-
t
ленной элементом информации Ii(t) = J Хг (t)dt.
0
В. Рассмотрим как будет вести себя во времени число допустимых состояний системы в целом, отражающее, в силу введенного выше предположения, эффективность научения:
n
n(t) = П Пг (t) = n0 exp (- I(t)),
i =1
n
где n0 = П ni0 ,
i =1
I(t) = ? I (t).
i =1
Если предположить, что характеристики элементов и темп поступления информации постоянны, то есть постоянно количество информации, перерабатываемое каждым элементом в единицу времени: Ii(t) = вг t, то (6.14) переходит в классическую экспоненту
n
с показателем I(t) = t ^6t .
i =1
А. Гипотеза о монотонном уменьшении числа допустимых состояний не снижает общности приведенных рассуждений, так как в случае их роста получится выражение вида
n(t) = n? (1 - e - I(t)), примерно с теми же промежуточными выкладками.
Результаты моделей 6.2, 6.3, 6.5, 6.6, и 6.8 могут рассматриваться как частные случаи модели 6.9.
Во всех моделях настоящего раздела скорость научения определяется количеством накопленной информации, поэтому для увеличения скорости научения, в рамках рассматриваемой модели, целесообразно выбирать как можно больший темп передачи информации. Следует, однако, учитывать, что в реальных системах
превышение некоторого порогового (для обучаемой системы) объема поступающей информации может оказать отрицательное влияние и снизить эффективность научения (аналог эффекта интерференции навыков). •
Таким образом, в теоретико-информационных моделях итеративного научения экспоненциальный характер кривых научения обусловлен постоянством количества информации, обрабатываемой, передаваемой, усваиваемой и т.д. элементами системы в единицу времени.
Еще по теме 6. Теоретико-информационные модели:
- 3.1. Система «человек — машина», информационная модель, концептуальная модель
- 10.4. Информационно#x2011;коммуникативная модель политической системы
- 2.3. Модели производственной деятельности сотрудников информационного центра
- 2.3.1. Модель деятельности управляющего информационным центром
- Часть II. Информационные модели соционики
- 2.5. Структурная модель современного информационного центра
- 2.6. Математическая модель человеко-машинного комплекса или информационного центра
- 7.1. Системный подход, особенности его применения при проектировании информационных моделей и сред
- 3.2. Планирование информационных потоков по лабораториям информационного центра
- Возражения критическим теоретикам
- § 2. Первопорядковая семантика (теория моделей)Определение 1 (модели)
-
Аксиология -
Аналитическая философия -
Античная философия -
Антология -
Антропология -
История философии -
История философии -
Логика -
Метафизика -
Мировая философия -
Первоисточники по философии -
Проблемы философии -
Современная философия -
Социальная философия -
Средневековая философия -
Телеология -
Теория эволюции -
Философия (учебник) -
Философия искусства -
Философия истории -
Философия кино -
Философия культуры -
Философия науки -
Философия политики -
Философия разных стран и времен -
Философия самоорганизации -
Философы -
Фундаментальная философия -
Хрестоматии по философии -
Эзотерика -
Эстетика -
-
Педагогика -
Cоциология -
БЖД -
Биология -
Горно-геологическая отрасль -
Гуманитарные науки -
Искусство и искусствоведение -
История -
Культурология -
Медицина -
Наноматериалы и нанотехнологии -
Науки о Земле -
Политология -
Право -
Психология -
Публицистика -
Религиоведение -
Учебный процесс -
Физика -
Философия -
Эзотерика -
Экология -
Экономика -
Языки и языкознание -