Вольфганг Штегмюллер РАЦИОНАЛЬНАЯ ТЕОРИЯ РЕШЕНИЙ (логика решений) *

1. Задачи рациональной теории решений

Исследование законов рациональной человеческой деятельности первоначально появилось в сфере экономического анализа, в частности в австрийской школе изучения потребностей, и близких к нему областях.

Многочисленные попытки математического уточнения данной проблемы в конечном итоге привели к созданию некоторой совершенно новой теории, а именно теории игр, которая увидела свет в обширном сочинении фон Неймана и Моргенштерна в 1943 г. В качестве важнейшей составной части этой теории игр и выделилась со временем рациональная теория решений, называемая также логикой решений. В ходе дискуссий становилось все более ясно, что многочисленные вопросы, включаемые в комплекс проблем "Вероятность и индукция", полностью или частично охватываются этой теорией. Поэтому нет ничего удивительного в том, что наряду с экономистами, представителями теории вероятности и статистиками интерес к этой области в растущей степени стали проявлять также логики и философы науки.

Непосредственной причиной последующего изложения является методологическое значение самой указанной области. Однако к этому присоединяется еще одно обстоятельство: данная первая часть одновременно служит для подготовки последующей реконструкции теории Карнапа, которая получила от него не совсем правильное название: ' индуктивная логика".

Мы можем выделить в истории два направления, которые вошли в современные исследования по логике решений и в определенной мере слились в них. Эти направления соответствуют двум важнейшим понятиям теории решений: понятию субъективной пользы, выра-

•Stegmiiller W. Entscheidungslogik (rationale Entschei- dungstheorie). Springer-Verlag, Berlin—Heidelberg-New York, 1973, S. 287-296.

жаемому некоторой функцией полезности, и понятию субъективной, или личной, вероятности, выражаемому некоторой вероятностной функцией. Исследования понятия субъективной пользы и субъективной ценности возникли в области экономической науки, причем решающий шаг в этом направлении был сделан представителями упомянутой австрийской школы изучения потребностей. Важнейшей проблемой в этой области является вопрос об измерении или, лучше сказать, о метризации субъективных соображений о полезности в виде функций полезности. Эта задача в течение длительного времени является важнейшей целью теоретической экономической науки, поскольку ее решение представляется предпосылкой создания адекватной теории ценообразования.

Вероятностный аспект появляется на первый взгляд гораздо позже, лишь в рамках теории игр. Правда, довольно быстро выяснилось, что здесь можно использовать более ранние теоретико-вероятностные исследования. В этой связи прежде всего заслуживают упоминания два имени — Ф. Рамсея и Б.де Финетти. Независимо друг от друга эти ученые пришли к оригинальной и интересной мысли о том, что понятие субъективной, или личной, вероятности можно уточнить с помощью изучения рационального заключения пари. Впервые эту идею высказал Рамсей. Не зная об этих соображениях Рамсея, опубликованных лишь посмертно, Финетти развил близкие идеи и даже описал способ оправдания основных аксиом теории вероятности. Позднее эти идеи были подхвачены Карнапом и его коллегами и сформулированы в языке карнаповских систем. Теория, названная нами "Карнап II" (и излагаемая во второй части), имеет дело с попыткой уточнения и развития вероятностных аспектов логики решений.

Теория решений имеет дело с решениями трех видов (и распадается соответственно на три области), а именно: решения, принимаемые с уверенностью; рискованные решения и безосновательные решения. В случае надежного решения субъект деятельности стремится узнать ситуацию настолько точно, чтобы иметь возможность с уверенностью предсказать последствия, своих возможных действий. В случае безосновательных решений он знаком с ситуацией так плохо, что даже приблизительно не способен оценить возможных последствий своих поступков. В последующем изложении мы не будем рассматривать эти случаи, а сконцентрируем внимание на важнейшем случае: на рискованных решениях. Речь будет идти о таких ситуациях принятия решений, в которых действующие субъекты не могут полностью контролировать все важные последствия своих действий и точно предвидеть их, однако в состоянии дать вероятностную оценку различным обстоятельствам и следствиям своих поступков.

Следующий раздел посвящен уточнению этой беглой и не вполне четкой характеристики рискованных решений.

2. Действия и их следствия

Три матрицы: следствий, полезности и вероятности.

Допустим, некоторый человек хотел бы перебраться из пункта у в пункт z. У него есть две возможности: ехать поездом или лететь самолетом. Он должен выбрать один из этих двух возможных способов действия. Если он решит поехать поездом, то затратит на поездку 7 часов. Если же он выберет самолет, то имеются две возможности: будет туман над местом посадки или будет ясная погода. При ясной погоде время полета равно 2 часам. В случае же тумана самолет может возвратиться^ время путешествия растянется до 16 часов. Обзор всех возможностей дает помещенная ниже таблица. Каждому возможному способу действий, между которыми индивид осуществляет выбор, соответствует одна строка этой таблицы. Каждому из двух релевантных обстоятельств (есть туман или нет тумана) соответствует одна колонка. Пересечение строчки с колонкой выражает то следствие, которое получается для индивида, если он избирает соответствующий этой строке способ действий и реализуется обстоятельство, соответствующее данной колонке. В рассматриваемом примере эти следствия заключаются в величине времени, затрачиваемого на поездку из пункта у и измеряемого в часах. В пункте прибытия В пункте прибытия ясно туман Поезд 7 час. 7 час. Самолет 2 час. 16 час.

Слова "поезд" и "самолет" здесь представляют два возможных способа действий, между которыми нужно выбрать: воспользоваться поездом или самолетом. Если опустить наименования строчек и столбцов и сохранить лишь числовые выражения следствий, то мы получим матрицу следствий, которая в рассматриваемом примере выглядит следующим образом:

О

Для того чтобы иметь возможность правильно прочитать эту матрицу, нужно знать, конечно, упомянутые названия строчек и столбцов. Кроме того, если следствия выражены в числах, нужно знать соответствующие меры (в данном случае меры времени). Тот факт, что первая строка дважды содержит число 7, является, конечно, чисто случайным. В нем выражается лишь то обстоятельство, что время поездки на поезде не зависит от того, имеется ли туман в пункте z или нет. Напротив, в других случаях может оказаться так, что все возможные результаты получат разные значения.

Отталкиваясь от этого простого примера, мы можем получить общую схему. Индивид, находящийся в определенной ситуации, хотел бы осуществить выбор ОДНОГО ИЗ m поступков ИЛИ действий Alt...tAm. Пусть для интересующих его возможных последствий выбора имеется п возможных состояний мира или природы, которые мы для краткости обозначим обстоятельствами UПусть наш индивид убежден также в том, что эти л обстоятельств образуют исчерпывающую дизъюнкцию всех возможных обстоятельств, a m поступков—исчерпывающую дизъюнкцию всех возможных действий.

Некоторому поступку Aj и обстоятельству Цг соответствует результат Ftik> о котором мы теперь будем говорить вместо прежнего следствия. Если по аналогии с вышеизложенным попытаться построить таблицу, то она примет следующий вид:

(/, и2 ... Un А\ Я.. Rn • ? • R\n At Rn Rx 2 . . . Rin

An ftni Rm2 • • • Hnn

Из этой таблицы получается матрица следствий, которую мы сокращенно будем называть матрицей (Rik). Относительно этого сокращения следует помнить, что первый индекс (индекс строк) при "Д" говорит о пронумерованных в определенной последовательности возможных поступках, а второй индекс (индекс столбцов) — о пронумерованных возможных обстоятельствах.

Примечание 1. Матрица следствий (Rik) может внушить ошибочное впечатление, будто бы в ней идет речь об объективных ситуациях. Это неверно. Задача данной матрицы заключается в описании ситуаций в их понимании действующим лицом. Действия Ах,...,Ат представляют собой не те действия, которые вообще возможны, а только те действия, которые принимает во внимание действующий индивид. Точно так же и ?/i ,...,?/„ представляют собой не объективно возможные положения дел, а возможности, рассматриваемые действующим субъектом. Вполне может оказаться, что субъект упустит из виду некоторые объективно возможные обстоятельства и возможные действия, которые он мог бы совершить.

Примечание 2. Построение матрицы следствий опирается на предположение о том, что каждый результат Rik однозначно определен, если фиксированы действие Аі и обстоятельство Uk. Можно было бы даже сказать, что эта матрица представляет некоторый дискретный детерминистический закон природы. Говоря языком математики, речь здесь идет о некоторой функции ^ с /шумя аргументами: Rik = s?(A, Ці).

Выражение "закон природы" следует, конечно, понимать с оговоркой, высказанной в предыдущем примечании: важно не то, существует ли на самом деле такой закон природы, а то, что в его существование верит действующий субъект. Последующие рассуждения сделают еще более ясным то обстоятельство, что в данном случае речь идет не об объективном положении дел, а только о субъективных убеждениях действующего субъекта. Правда, здесь появляется одна сложность, на которую мы должны указать уже сейчас: обсуждаемая субъективная оценка вероятности возможных обстоятельств не обязана автоматически переноситься на результат, напротив, последним можно приписывать субъективные вероятности, зависимые от действий.

Примечание 3. Читателя не должно смущать то обстоятельство, что разные авторы избирают различные виды формализации, которые только по видимости опираются на интуитивные представления, отличающиеся друг от друга, но в действительности говорят об одном и том же и различаются лишь несущественными техническими деталями. Для иллюстрации этого факта сравним введенную выше матрицу следствий с определением действия Л.Дж. Сэвиджем. Согласно тому, что было сказано в примечании 2, матрицу следствий можно представить в виде двуместной функции, аргументами которой являются действия и обстоятельства, а значениями — результаты R^. В противоположность этому Сэвидж определяет действия как отображения множества обстоятельств в множество следствий.1 Таким образом, он пользуется одноместными функциями. Однако это лишь иная формулировка той же самой процедуры. Если мы в нашем формальном выражении фиксируем первый индекс символа Rik для некоторого определенного і, а второму индексу k позволим изменяться от 1 до п, то мы как раз получим одноместную функцию, которая представляет действие А и фактически является отображением класса обстоятельств в класс результатов. Мы хотим представить матрицу следствий посредством единственной двуместной функции, в то время как Сэвидж каждое из рассматриваемых действий предпочитает представлять некоторой собственной функцией, так что наша матрица (Rfc) может быть получена из m различных одноместных функций при i'=l,...,m. Какому из двух видов представления отдать предпочтение, определяется только целесообразностью. В одних контекстах можно рекомендовать первый, в других — второй способ.

Сэвидж извращенно трактует также субъективный характер того, что мы назвали следствием, или результатом. Когда он "следствие" отождествляет с "состоянием личности", мне представляется, что это способно привести к недоразумению. Используя такую терминологию, непроизвольно начинают думать не о субъективно оцениваемых следствиях действий, а о психофизических состояниях или о чисто духовных переживаниях (ощущение боли, хорошее настроение, состояние депрессии и т.п.).

'Savage L.

J. The Foundations of Statistics. New York- London, 1954. To, что мы называем обстоятельством, в точности соответствует "состоянию мира" у Сэвиджа в указанной работе.

Сэвидж совершенно справедливо подчеркивает, что речь всегда идет об индивиде в некоторой определенной ситуации. Для нашего исследования это является очевидной предпосылкой. Поскольку мы всегда говорим об одном и том же индивиде в определенной ситуации решения, постольку нам не нужно проводить никакой особой релятивизации. В теории "Карнап II" дело обстоит иначе. Здесь мы должны, с одной стороны, говорить об оценках полезности и вероятности разных индивидов, с другой же стороны, вынуждены проводить различие между такими оценками одного и того же индивида для разных моментов времени. Поэтому в последнем формализме приходится делать явную ссылку на индивида X и момент времени Т. В нашем контексте это будет излишним.

Теперь мы рассмотрим матрицу полезности, иногда называемую также матрицей желаемости. Для ее построения мы должны предположить, что все возможные результаты R^ получили субъективную оценку. Наш индивид, размышляющий о том, какое действие ему выбрать, отныне будет именоваться просто субъектом (и иногда обозначаться символом "л"). Мы предполагаем также, что каждому из mXn возможных результатов Rn,...,Rmn наш X приписывает некоторую субъективную полезность. Мы пойдем даже несколько дальше и предположим, что эту субъективную полезность можно охарактеризовать действительным числом. (Вопрос о том, каким образом можно прийти к такой числовой шкале и в какой мере такая шкала будет однозначной, мы на некоторое время оставим в стороне.) Установив для каждого возможного результата его субъективную полезность, получают матрицу полезности.

Для наглядности вновь обратимся к примеру, приведенному выше. Пусть наш субъект будет весьма ответственным коммерсантом, для которого время — деньги. Другими словами это можно выразить так: потерять время для него означает потерять деньги. Поскольку время, затраченное на поездку, он должен считать потерянным, постольку перед каждым числом, выражающим такое время, он должен поставить знак отрицания, обозначающий субъективную полезность этого времени. Поэтому матрица полезности примет такой вид:

Здесь одновременно становится ясным, что под полезностью мы понимаем не только то, что называют позитивной полезностью, ибо субъективная полезность может быть также убытком или субъективной утратой. В случаях последнего рода субъективные полезности будут представляться отрицательными числами.

В общем случае имеет место следующее: мы должны допустить, что существует некоторая функция пи, которая зависит от нашего субъекта X и называется функцией полезности. Аргументами этой функции являются возможные результаты Rik, а значениями — реальные числа, представляющие субъективную ценность этих результатов. Если функцию пи приметіть ко всем результатам, входящим в матрицу следствий, то мы получим матрицу полезности, которую сокращенно можно записать в виде inu(Rjk)). (Внутренние скобки относятся к функтору 'пи", внешние — являются составной частью символической записи матрицы.) Значение функции пи для R^ мы называем (субъективной) полезностью или пользой результата Rik для субъекта. Полезности, т.е. m X п значений nu(Ru ),...,nu(Rmn), можно упорядочить по величине. Получившийся таким образом порядок мы называем числовым порядком полезностей (результатов или следствий). Конечно, в этом порядке мы можем нескольким возможным результатам приписать одно и то же место. Это возможно, в частности, для самых высоких и для самых низких по своей оценке результатов.

Если мы хотим представить матрицу следствий вместе с матрицей полезности в виде одной диаг раммы, то для этого следует избрать трехмерное изображение. Нужно взять прямоугольную систему координат и в одном из квадрантов построить сетку маленьких квадратов, каждый из которых соответствует некоторому результату Rjk (на оси х отмечаются возможные действия, на оси у — возможные обстоятельства, таким образом, данный квадрант будет изображением матрицы следствий). Значения полезности nu(R^) будут представлены осью г, которая каждому квадранту (вернее, соответствующему результату) сопоставляет особое значение.

Третьим фундаментальным понятием, которое нас здесь интересует, является понятие матрицы вероятностей. Поскольку мы имеем дело с рискованными решениями, постольку мы можем предположить, что наш субъект способен оценить вероятность наступления каждого из п обстоятельств. Вероятность наступления обстоятельства Ц при і - 1 ,...,п мы записываем в виде р(Ч) ("р" означает "вероятность"). Здесь также речь идет не об объективной вероятности появления обстоятельств, даже если и верят, что такие вероятности существуют. Если бы такие вероятности и существовали, они были бы либо совершенно неизвестны субъекту, либо он мог бы высказать о них только гипотетические предположения. Однако субъект должен иметь возможность вычислять вероятности для того, чтобы прийти к решению относительно выбора возможного действия. Субъект должен знать возможные обстоятельства, возможные действия, результаты, входящие в матрицу следствий, а также их полезность. И точно так же вероятности возможных обстоятельств относятся к тем данным, которые ему должны быть известны и которые служат основой рациональных соображений о правильном решении. Таким образом, речь может идти только о субъективных вероятностях. Определенные условия, которым должна удовлетворять субъективная оценка вероятностей, будут обсуждаться ниже.

В качестве третьей матрицы мы вводим матрицу вероятностей. В отличие от матриц следствий и полез- ностей здесь нужна некоторая дифференциация. Простейшим случаем будет тот, который мы называем матрицей верояностей, независимых от действия. Он относится к вероятности реализации любого обстоятельства Uk независимо от того, какое действие будет предпринято. Таким образом, достаточно знать п значений p{Ux) = pi ,р(С4) = pj ,...,p(Un) = рь. Если эти значения Pi ... »Ai известны, то мы можем сказать, что задано распределение вероятностей для обстоятельств. Теперь матрица вероятностей образуется просто за счет того, что строчки с этими п значениями m раз подписываются одна под другой (каждому возможному действию будет соответствовать одна строка). Такая матрица вероятностей имеет следующий вид:

P>.P2.—.Ai

m строк

Pi »PJ ."ЧАІ

С такой матрицей вероятностей, независимых от действий, мы в нашем примере имеем дело в том случае, если путешественник не является суеверным человеком, т.е. если он убежден в том, что погода в том месте, куда он стремится, не зависит от того, едет он поездом или летит самолетом. (Напротив, если бы он не в шутку, а всерьез сказал: Если я воспользуюсь самолетом, то в месте прибытия z несомненно будет туман; если же я поеду поездом, то гам будет солнечно", то мы имели бы дело со вторым случаем матрицы вероятностей, зависящих от действия.) Если р представляет собой вероятность того, что в месте назначения нет тумана, то вероятность тумана в этом месте будет равна 1 — р, так как сумма вероятностей этих двух исключающих друг друга альтернатив должна иметь значение 1. Для используемого нами примера матрица вероятностей примет следующий вид:

р 1 —р Р 1 -Р -

Предположим, что вероятность наличия тумана в месте назначения для субъекта равна 5/14. Тогда приведенная выше матрица будет выглядеть так:

9/14 5/14 9/14 5/14 .

Другим, более сложным случаем является матрица вероятностей, зависимых от действия. В первом случае было достаточно знать распределение вероятностей для п обстоятельств и воспроизводить это распределение для каждого из m возможных действий. Теперь мы имеем дело с таким положением, когда вероятность осуществления некоторого обстоятельства зависит также от того, какое действие будет предпринято. Рассматривавшийся нами пример не подходит для иллюстрации этого положения, которое опирается на предположение о суеверности субъекта. Более подходящим будет следующий пример80.

Тридцатипятилетний американец X ежедневно выкуривает по две пачки сигарет. Он знакомится со статистическими данными Американского ракового общества и начинает колебаться. В этих данных содержатся сведения о том, каковы шансы 35-летнего мужчины прожить больше 65 лет в зависимости от того, курит он или не курит, а также курит ли он мало, много или очень много. X констатирует, что ему не хватает силы воли заставить себя выкуривать меньше двух пачек сигарет в день, если он продолжает курить сигареты. Однако у него есть возможность начать курить трубку или сигареты, что будет доставлять ему гораздо меньше удовольствия. В данном случае нас интересует не матрица полезности, а только его матрица вероятностей, которую он составил на основе упомянутых статистических данных. (Вследствие того, что он не сомневается в этих данных, его субъективные вероятности будут совпадать с объективными относительными частотами, приведенными в статистических данных.) Умирают Доживают до 65

е

двух пачек сигарет в

до 65 лет до 65 лет

Выкуривают не менее двух пачек сигарет в

день 0,41 0,59

Курят только трубку

или сигары 0,25 0,75

Для построения обшей схемы нам нужно использовать понятие условной вероятности. Пусть р(Цг, А) представляет субъективную вероятность осуществления Uk при том условии, что было осуществлено действие Д. Если это значение мы кратко запишем как , то схема матрицы вероятностей, зависимых от действия, будет выглядеть следующим образом: Ґ~Р1». . . Ан

\ Рт\ • » • Ртп

В случае матрицы вероятностей, не зависимых от действия, мы говорили о распределении вероятностей для обстоятельств, которое затем автоматически (стро-

Перестановка индексов і и k по сравнению с введенным выше выражением обусловлена тем, что мы хотим сохранить ту последовательность индексов, которая была принята для обозначения результата R^. Это нужно для того, чтобы введенный выше способ записи сохранить для обозначения условной вероятности. ка за строкой) переносили на результаты. Теперь мы вынуждены говорить только о распределении вероятностей для результатов. Поскольку каждый результат Rik зависит от А и Uk, мы можем определить: p(Rik)~ Rk -Р(ЦЛ).

Итак, мы собрали понятийный материал, который поможет ответить нам на некоторые вопросы теории решений.

Примечание. Сделаем краткое указание относительно того, каким образом обрисованный выше аппарат можно обобщить так, что будет применима абстрактная теория вероятностей. Прежде всего рассмотрим распределение вероятностей, независимых от действия, что позволяет нам ограничиться только обстоятельствами. Эти обстоятельства можно представлять как элементы пространств возможностей (пространств выборки) П. До сих пор мы всегда имели дело только с конечным множеством обстоятельств, однако можно рассмотреть случай и с бесконечным множеством обстоятельств и даже перейти к рассмотрению несчетного множества обстоятельств. В дискретном случае каждое подмножество множества П образует некоторое событие. В случае непрерывности вновь нужно действовать так, чтобы выбрать некоторый класс подмножеств и рассматривать образованную этим классом о-структуру. Тогда события становятся элементами этих о-структур. Вероятность образует неотрицательную, аддитивную и нормированную меру на этой о-струкгуре.

Аналогичное обобщение может быть осуществлено для действий: вместо конечного множества возможных действий следует рассматривать бесконечное множество.

Если вероятности следствий зависят от действий, то в качестве элементов пространства возможностей следует брать не обстоятельства, а результаты. В остальном все остается точно так же.

<< | >>
Источник: В. В. Петрова, Д. П. Горского. Ф Философия, логика, язык: Пер. с англ. инем./Сост. и предисл. В. В. Петрова; Общ. ред. Д. П. Горского и В. В. Петрова. — М.; Прогресс, 1987.— 336 с.. 1987

Еще по теме Вольфганг Штегмюллер РАЦИОНАЛЬНАЯ ТЕОРИЯ РЕШЕНИЙ (логика решений) *:

  1. 10. Дополнительное решение. Разъяснение решения.Исправление описок, опечаток, арифметических ошибок. Вступление решения в законную силу. Обжалование решения. Исполнение решения
  2. 11. ДОПОЛНИТЕЛЬНОЕ РЕШЕНИЕ. РАЗЪЯСНЕНИЕ РЕШЕНИЯ. ИСПРАВЛЕНИЕ ОПИСОК, ОПЕЧАТОК, АРИФМЕТИЧЕСКИХ ОШИБОК. ВСТУПЛЕНИЕ РЕШЕНИЯ В ЗАКОННУЮ СИЛУ. ОБЖАЛОВАНИЕ РЕШЕНИЯ. ИСПОЛНЕНИЕ РЕШЕНИЯ
  3. РАЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ РАБОТЫ УМА— РЕШЕНИЕ СЛОЖНЫХ ПРОБЛЕМ
  4. Гомбоева Л.В.. Индивидуальные контрольные задания по логике с методическими указаниями по их решению, 2003
  5. Теория решения изобретательских задач (ТРИЗ) и ее применение
  6. 9. Сущность и содержание решения арбитражного суда, объявление решения
  7. 22.5. Производство по делам о признании и приведении к исполнению решений иностранных судов и иностранных арбитражных решений
  8. Решения исполнителя - Ваши решения
  9. 2. Оспаривание решений третейских судов. Порядок оформления и рассмотрения заявления, основания для отмены решения третейского суда, определение арбитражного суда по данной категории дел
  10. § 2. Институт заочного решения по Уставу гражданского судопроизводства 1864 г. 2.1. Цели введения института заочного решения
  11. § 4. Способы и порядок пересмотра заочных решений 4.1. Пересмотр заочного решения вынесшим его судом
  12. ГЛАВА 22. ПРОИЗВОДСТВО ПО ДЕЛАМ ОБ ОСПАРИВАНИИ РЕШЕНИЙ ТРЕТЕЙСКИХ СУДОВ И О ВЫДАЧЕ ИСПОЛНИТЕЛЬНЫХ ЛИСТОВ НА ПРИНУДИТЕЛЬНОЕ ИСПОЛНЕНИЕ РЕШЕНИЙ ТРЕТЕЙСКИХ СУДОВ