Равновесие по нэшу. Равновесие по нэшу в чистых и смешанных стратегиях

Ситуации, когда в игре существует равновесие в доминирующих стратегиях, достаточно редки. И далеко не во всех играх можно найти решение, отбрасывая строго доминируемые стратегии. Соответствующий пример игры представлен в Таблице 16.8 .

Второй игрок выберет стратегию A, если предполагает, что первый выберет стратегию Z; в то же время стратегия B для него предпочтительнее в случае, если первый выберет Y.

Таблица 16.8.

Естественно предположить, что при отсутствии у всех игроков доминирующих стратегий, выбор каждого игрока зависит от ожиданий того, какими будут выборы других. Далее мы рассмотрим концепцию решения, основанную на этой идее.

16.2.4 Равновесие по Нэшу

Кроме ситуаций, рассмотренных в предыдущем разделе, бывают ситуации14 , которые естественно моделировать, исходя из следующих предположений:

игроки при принятии решений ориентируются на предполагаемые действия партнеров;

ожидания являются равновесными (совпадают с фактически выбранными партнерами действиями).

Если считать, что все игроки рациональны, так что каждый выбирает стратегию, дающую ему наибольший выигрыш при данных ожиданиях, то эти предположения приводят к концепции решения, называемой равновесием Нэша . В равновесии у каждого игрока нет оснований пересматривать свои ожидания.

Формально равновесие Нэша определяется следующим образом.

Определение 90:

Набор стратегий x X является равновесием Нэша15 , если

1) стратегия x i каждого игрока является наилучшим для него откликом на ожидаемые им стратегии других игроков xe −i :

ui (xi , xe −i ) = max ui (xi , xe −i ) i = 1, . . . , n;

x iX i

14 Можно представить себе популяцию игроков типа А (скажем, кошки) и игроков типа Б (скажем, мышки). Игрок типа А при встрече с игроком типа Б имеет оправданные своим или чужим опытом ожидания относительно поведения партнера типа Б, и заранее на них ориентируется (и наоборот). Однако это не единственный тип ситуаций, в которых рассматриваемый подход является адекватным.

15 Американский математик Джон Нэш получил Нобелевскую премию по экономике в 1994 г. вместе с Дж. Харшаньи и Р. Зельтеном «за новаторский анализ равновесий в теории некооперативных игр». Концепция равновесия была предложена в следующих статьях: J. F. Nash: Equilibrium Points in N-Person Games,

Proceedings of the National Academy of Sciences of the United States of America 36 (1950): 48–49; J. F. Nash: NonCooperative Games, Annals of Mathematics 54 (1951): 286–295 (рус. пер. Дж. Нэш: Бескоалиционные игры, в кн. Матричные игры, Н. Н. Воробьев (ред.), М.: Физматгиз, 1961: 205–221).

Следует оговориться, что сам Нэш не вводил в определение ожиданий. Исходное определение Нэша совпадает с тем свойством, о котором говорится далее.

xe −i = x−i i = 1, . . . , n

Заметим, что при использовании равновесия Нэша для моделирования игровых ситуаций вопросы о том, знают ли игроки цели партнеров, знают ли они о рациональности партнеров, умеют ли их просчитывать, и т. д., отходят на второй план. Способ формирования ожиданий выносится за рамки анализа; здесь важно только то, что ожидания являются равновесными.

Но если при анализе равновесия Нэша не важно, знает ли игрок цели других игроков, то может возникнуть сомнение в правомерности рассмотрения концепции Нэша в контексте игр с полной информацией. Все дело в том, что термин «полная информация» в теории игр имеет довольно узкое значение. Он фактически подразумевает только полноту сведений о типах партнеров (термин «тип игрока», разъясняется в параграфе, посвященном байесовским играм).

Как легко видеть, приведенное определение равновесия Нэша эквивалентно следующему свойству, которое обычно и используется в качестве определения:

Набор стратегий x X является равновесием Нэша, если стратегия xi каждого игрока является наилучшим для него откликом на стратегии других игроков x−i :

ui (xi , x−i ) = max ui (xi , x−i ) i = 1, . . . , n

x iX i

Это свойство можно также записать в терминах так называемых функций (отображений) отклика.

Определение 91:

Отображение отклика i-го игрока,

Ri : X−i 7→Xi

сопоставляет каждому набору стратегий других игроков, x−i X−i , множество стратегий i-го игрока, каждая из которых является наилучшим откликом на x−i . Другими словами,

ui (yi , x−i ) = max ui (xi , x−i ) x−i X−i , yi Ri (x−i )x i X i

Введение отображений отклика позволяет записать определение равновесия Нэша более компактно: набор стратегий x X является равновесием Нэша, если

xi Ri (x−i ) i = 1, . . . , n

Если отклик каждого игрока однозначен (является функцией), то множество равновесий Нэша совпадает с множеством решений системы уравнений:

xi = Ri (x−i ) i = 1, . . . , n.

В Таблице 16.8 отображения отклика игроков изображены подчеркиванием выигрышей, соответствующих оптимальным действиям. Равновесие Нэша в данной игре - клетка (B, Y), поскольку выигрыши обоих игроков в ней подчеркнуты.

Проиллюстрируем использование функций отклика на примере игры, в которой игроки имеют континуум стратегий.

Игра 5. «Международная торговля»

Две страны одновременно выбирают уровень таможенных пошлин, τi . Объем торговли между странами16 , x, зависит от установленных пошлин как

x = 1 − τ1 − τ2

Цель каждой страны - максимизировать доходы ui = τi x.

Максимизируем выигрыш 1-й страны,

τ1 (1 − τ1 − τ2 )

по τ1 считая фиксированным уровень пошлины, установленный 2-й страной. Условие первого порядка имеет вид

1 − 2τ1 − τ2 = 0

Поскольку максимизируемая функция строго вогнута, то условие первого порядка соответствует глобальному максимуму.

Условие первого порядка для задачи максимизации выигрыша 2-й страны находится аналогично:

1 − τ1 − 2τ2 = 0

Решив систему из двух линейных уравнений, найдем равновесие Нэша:

τ1 = τ2 = 1/3

Оптимальный отклик 1-й страны на уровень таможенной пошлины, установленной 2-й страной описывается функцией

τ1 (τ2 ) =1 − τ 2

Аналогично, функция отклика 2-й страны имеет вид

τ2 (τ1 ) =1 − τ 1 2

Чтобы найти равновесие Нэша, требуется решить систему уравнений

τ1 (τ2 ) = τ1 ,

τ2 (τ) = τ .

Графически поиск равновесия Нэша показан не Рис. 16.3 . Точки, лежащие на кривых оптимального отклика τ1 (τ2 ) и τ2 (τ1 ), характеризуются тем, что в них касательные к кривым безразличия игроков параллельны соответствующей оси координат. Напомним, что кривой безразличия называют множество точек, в которых полезность рассматриваемого индивидуума одна и та же (ui (x) = const). Равновесие находится как точка пересечения кривых отклика.

Преимущество использования концепции равновесия Нэша состоит в том, что можно найти решение и в тех играх, в которых отбрасывание доминируемых стратегий не позволяет этого сделать. Однако сама концепция может показаться более спорной, поскольку опирается на сильные предположения о поведении игроков.

Связь между введенными концепциями решений описывается следующими утверждения-

16 В этой игре мы для упрощения не делаем различия между экспортом и импортом.

(τ2 )

равновесия

τ2 (τ1 )

Рис. 16.3. Равновесие Нэша в игре «Международная торговля»

Теорема 151:

Если x = (x1 , . . . , xm ) - равновесие Нэша в некоторой игре, то ни одна из составляющих его стратегий не может быть отброшена в результате применения процедуры последовательного отбрасывания строго доминируемых стратегий.

Обратная теорема верна в случае единственности.

Теорема 152:

Если в результате последовательного отбрасывания строго доминируемых стратегий у каждого игрока остается единственная стратегия, xi , то x = (x1 , . . . , xm ) - равновесие Нэша в этой игре.

Доказательства этих двух утверждений даны в Приложении B (с. 641 ). Нам важно здесь, что концепция Нэша не входит в противоречие с идеями рациональности, заложенной в процедуре отбрасывания строго доминируемых стратегий.

По-видимому, естественно считать, что разумно определенное равновесие, не может быть отброшено при последовательном отбрасывании строго доминируемых стратегий. Первую из теорем можно рассматривать как подтверждение того, что концепция Нэша достаточно разумна. Отметим, что данный результат относится только к строгому доминированию. Можно привести пример равновесия Нэша с одной или несколькими слабо доминируемыми стратегиями (см. напр. Таблицу16.11 на с.652 ).

16.2.5 Равновесие Нэша в смешанных стратегиях

Нетрудно построить примеры игр, в которых равновесие Нэша отсутствует. Следующая игра представляет пример такой ситуации.

Игра 6. «Инспекция»

В этой игре первый игрок (проверяемый) поставлен перед выбором - платить или не платить подоходный налог. Второй - налоговой инспектор, решает, проверять или не проверять именно этого налогоплательщика. Если инспектор «ловит» недобросовестного налогоплательщика, то взимает в него штраф и получает поощрение по службе, более чем компенсирующее его издержки; в случае же проверки исправного налогоплательщика, инспектор, не получая поощрения, тем не менее несет издержки, связанные с проверкой. Матрица выигрышей представлена в Таблице 16.9 .

Таблица 16.9.

Инспектор

проверять

не проверять

нарушать

Проверяемый

не нарушать

Если инспектор уверен, что налогоплательщик выберет не платить налог, то инспектору выгодно его проверить. С другой стороны, если налогоплательщик уверен, что его проверят, то ему лучше заплатить налог. Аналогичным образом, если инспектор уверен, что налогоплательщик заплатит налог, то инспектору не выгодно его проверять, а если налогоплательщик уверен, что инспектор не станет его проверять, то он предпочтет не платить налог. Оптимальные отклики показаны в таблице подчеркиванием соответствующих выигрышей. Очевидно, что ни одна из клеток не может быть равновесием Нэша, поскольку ни в одной из клеток не подчеркнуты одновременно оба выигрыша.

В подобной игре каждый игрок заинтересован в том, чтобы его партнер не смог угадать, какую именно стратегию он выбрал. Этого можно достигнуть, внеся в выбор стратегии элемент неопределенности.

Те стратегии, которые мы рассматривали раньше, принято называть чистыми стратегиями . Чистые стратегии в статических играх по сути дела совпадают с действиями игроков. Но в некоторых играх естественно ввести в рассмотрение также смешанные стратегии. Подсмешанной стратегией понимают распределение вероятностей на чистых стратегиях. В частном случае, когда множество чистых стратегий каждого игрока конечно,

Xi = {x1 i , . . . , xn i i }

(соответствующая игра называется конечной ,), смешанная стратегия представляется вектором вероятностей соответствующих чистых стратегий:

µi = (µ1 i , . . . , µn i i )

Обозначим множество смешанных стратегий i-го игрока через Mi :

Mi = µi µk i > 0, k = 1, . . . , ni ; µ1 i + · · · + µn i i = 1

Как мы уже отмечали, стандартное предположение теории игр (как и экономической теории) состоит в том, что если выигрыш - случайная величина, то игроки предпочитают действия, которые приносят им наибольший ожидаемый выигрыш. Ожидаемый выигрыш i-го игрока, соответствующий набору смешанных стратегий всех игроков, (µ1 , . . . , µm ), вычисляется по формуле

Ожидание рассчитывается в предположении, что игроки выбирают стратегии независимо (в статистическом смысле).

Смешанные стратегии можно представить как результат рандомизации игроком своих действий, то есть как результат их случайного выбора. Например, чтобы выбирать каждую из двух возможных стратегий с одинаковой вероятностью, игрок может подбрасывать монету.

Эта интерпретация подразумевает, что выбор стратегии зависит от некоторого сигнала, который сам игрок может наблюдать, а его партнеры - нет17 . Например, игрок может выбирать стратегию в зависимости от своего настроения, если ему известно распределение вероятностей его настроений, или от того, с какой ноги он в этот день встал18 .

Определение 92:

Набор смешанных стратегий µ = (µ1 , . . . , µm ) являетсяравновесием Нэша в смешанных стратегиях , если

1) стратегия µ i каждого игрока является наилучшим для него откликом на ожидаемые им стратегии других игроков µe −i :

U(µi , µe −i ) = max U(µi , µe −i ) i = 1, . . . , n;

µ iM i

2) ожидания совпадают с фактически выбираемыми стратегиями:

µe −i = µ−i i = 1, . . . , n.

Заметим, что равновесие Нэша в смешанных стратегиях является обычным равновесием Нэша в так называемом смешанном расширении игры, т. е. игре, чистые стратегии которой являются смешанными стратегиями исходной игры.

Найдем равновесие Нэша в смешанных стратегиях в Игре 16.2.5 .

Обозначим через µ вероятность того, что налогоплательщик не платит подоходный налог,

а через ν - вероятность того, что налоговой инспектор проверяет налогоплательщика.

В этих обозначениях ожидаемый выигрыш налогоплательщика равен

U1 (µ, ν) = µ[ν · (−1) + (1 − ν) · 1] + (1 − µ)[ν · 0 + (1 − ν) · 0] =

= µ(1 − 2ν),

а ожидаемый выигрыш инспектора равен

U2 (µ, ν) = ν[µ · 1 + (1 − µ) · (−1)] + (1 − µ)[µ · 0 + (1 − µ) · 0] = = ν(2µ − 1)

Если вероятность проверки мала (ν < 1/2), то налогоплательщику выгодно не платить налог, т. е. выбрать µ = 1. Если вероятность проверки велика, то налогоплательщику выгодно заплатить налог, т. е. выбрать µ = 0. Если же ν = 1/2, то налогоплательщику все равно, платить налог или нет, он может выбрать любую вероятность µ из интервала . Таким образом, отображение отклика налогоплательщика имеет вид:

Рассуждая аналогичным образом, найдем отклик налогового инспектора:

0, если µ < 1/2

ν(µ) = , если µ = 1/2

1, если µ > 1/2.

17 Если сигналы, наблюдаемые игроками, статистически зависимы, то это может помочь игрокам скоординировать свои действия. Это приводит к концепции коррелированного равновесия.

18 Впоследствии мы рассмотрим, как можно достигнуть эффекта рандомизации в рамках байесовского равновесия.

Графики отображений отклика обоих игроков представлены на Рис. 16.4 . По осям на этой диаграмме откладываются вероятности (ν и µ соответственно). Они имеют единственную общую точку (1/2, 1/2). Эта точка соответствует равновесию Нэша в смешанных стратегиях. В этом равновесии, как это всегда бывает в равновесиях с невырожденными смешанными стратегиями (то есть в таких равновесиях, в которых ни одна из стратегий не выбирается с вероятностью 1), каждый игрок рандомизирует стратегии, которые обеспечивают ему одинаковую ожидаемую полезность. Вероятности использования соответствующих чистых стратегий, выбранные игроком, определяются не структурой выигрышей данного игрока, а структурой выигрышей его партнера, что может вызвать известные трудности с интерпретацией данного решения.

Рис. 16.4. Отображения отклика в игре «Инспекция»

В отличие от равновесия в чистых стратегиях, равновесие в смешанных стратегиях в конечных играх существует всегда19 , что является следствием следующего общего утверждения.

Теорема 153:

Предположим, что в игре G = hI, {Xi }i I , {ui }i I i у любого игрока множество стратегий Xi непусто, компактно и выпукло, а функция выигрыша ui (·) вогнута по xi и непрерывна. Тогда в игре G существует равновесие Нэша (в чистых стратегиях).

Существование равновесия Нэша в смешанных стратегиях в играх с конечным числом чистых стратегий является следствием того, что равновесие в смешанных стратегиях является равновесием в чистых стратегиях в смешанном расширении игры.

Теорема 154 (Следствие (Теорема Нэша)):

Равновесие Нэша в смешанных стратегиях существует в любой конечной игре.

Заметим, что существование в игре равновесия в чистых стратегиях не исключает существования равновесия в невырожденных смешанных стратегиях.

Рассмотрим в Игре 16.2.1 «Выбор компьютера» случай, когда выгоды от совместимости значительны, т. е. a < c и b < c. В этом варианте игры два равновесия в чистых стратегиях: (IBM, IBM) и (Mac, Mac). Обозначим µ и ν вероятности выбора компьютера IBM PC первым и вторым игроком соответственно. Ожидаемый выигрыш 1-го игрока равен

U1 (µ, ν) = µ[ν · (a + c) + (1 − ν) · a] + (1 − µ)[ν · 0 + (1 − ν) · c] = = µ[ν · 2c − (c − a)] + (1 − ν)c

а его отклик имеет вид

µ(ν) = ,

Ожидаемый выигрыш 2-го игрока равен

если ν < (c − a)/2c

если ν = (c − a)/2c

если ν > (c − a)/2c.

U2 (µ, ν) = ν[µ · c + (1 − µ) · 0] + (1 − ν)[µ · b + (1 − µ) · (b + c)] =

= ν[µ · 2c − (b + c)] + b + (1 − µ)c

а его отклик имеет вид

ν(µ) = ,

если µ < (b + c)/2c

если µ = (b + c)/2c

если µ > (b + c)/2c.

Графики отображений отклика и точки, соответствующие трем равновесиям изображены на Рис. 16.5 . Как видно, в рассматриваемой игре кроме двух равновесий в чистых стратегиях имеется одно равновесие в невырожденных смешанных стратегиях. Соответствующие вероятности равны

µ = b + cи ν = c − a

Рис. 16.5. Случай, когда в игре «Выбор компьютера» существует три равновесия, одно из которых - равновесие в невырожденных смешанных стратегиях

Приложение A

Теорема повторяется, номер обновляется, ссылки на это приложение нет. Можно поменять местами A и B

Теорема 155:

Предположим, что в игре G = hI, {Xi }i I , {ui0 }i I i у любого игрока множество стратегий Xi непусто, компактно и выпукло, а функция выигрыша ui (·) вогнута по xi и непрерывна. Тогда существует равновесие Нэша.

Доказательство: Докажем, что отображение отклика, Ri (·), каждого игрока полунепрерывно сверху и его значение при каждом x−i X−i непусто и выпукло. Непустота следует из теоремы Вейерштрасса (непрерывная функция на компакте достигает максимума).

16.2. Статические игры с полной информацией

Докажем выпуклость. Пусть z0 , z00 Ri (x−i ). Очевидно, что u(z0 , x−i ) = u(z00 , x−i вогнутости по xi функции ui (·) следует, что при α

u(αz0 + (1 − α)z00 , x−i ) > αu(z0 , x−i ) + (1 − α)u(z00 , x−i ) =

U(z0 , x−i ) = u(z00 , x−i )

Поскольку функция ui (·) достигает максимума в точках z0 и z00 , то строгое неравенство

невозможно. Таким образом,

αz0 + (1 − α)z00 Ri (x−i )

Докажем теперь полунепрерывность сверху отображения Ri (·). Рассмотрим последовательность xn i сходящуюся к x¯i и последовательность xn −i сходящуюся к x¯−i , причем xn i Ri (xn −i ). Заметим, что в силу компактности множеств Xj x¯i Xi и x¯−i X−i . Нам нужно доказать, что x¯i Ri (x¯−i ). По определению отображения отклика

u(xn i , xn −i ) > u(xi , xn −i ) xi Xi , n

Из непрерывности функции ui (·) следует, что

u(¯xi , x¯−i ) > u(xi , x¯−i ) xi Xi

Тем самым, по введенному выше определению отображения отклика, x¯i Ri (x¯−i ). Опираясь на доказанные только что свойства отображения Ri (·) и на теорему Какутани,

докажем существование равновесия по Нэшу, то есть такого набора стратегий x X , для

которого выполнено

xi Ri (x−i ) i = 1, . . . , n

Определим отображение R(·) из X в X следующим образом:

R(x) = R1 (x−1 ) × · · · × Rn (x−n )

Отметим, что это отображение удовлетворяет тем же свойствам, что и каждое из отображений Ri (·), так как является их декартовым произведением.

Отображение R(·) и множество X удовлетворяют свойствам, которые необходимы для выполнения теоремы Какутани. Таким образом, существует неподвижная точка отображения

Очевидно, что точка x есть равновесие по Нэшу.

Приложение B

В этом приложении мы формально докажем утверждения о связи между равновесием Нэша и процедурой последовательного отбрасывания строго доминируемых стратегий.

Сначала определим формально процедуру последовательного отбрасывания строго доминируемых стратегий. Пусть исходная игра задана как

G = hI, {Xi }I , {ui }I i.

Определим последовательность игр {G[t] }t=0,1,2,... , каждая из которых получается из последующей игры отбрасыванием строго доминируемых стратегий. Игры отличаются друг от друга множествами допустимых стратегий:

G[t] = hI, {Xi [t] }I , {ui }I i

Процедура начинается с G= G.

Множество допустимых стратегий i-го игрока на шаге t + 1 рассматриваемой процедуры берется равным множеству не доминируемых строго стратегий i-го игрока в игре t-го шага. Множества не доминируемых строго стратегий будем обозначать через NDi (см. определение строго доминируемых стратегий (Определение89 , с.631 )). Формально

NDi = xi Xi yi Xi : ui (yi , x−i ) > ui (xi , x−i ) x−i X−i

Таким образом, можно записать шаг рассматриваемой процедуры следующим образом:

X i = ND i [t]

где NDi [t] - множество не доминируемых строго стратегий в игре G[t] .

Приведем теперь доказательства Теорем 151 и152 (с.636 ). Теорема151 утверждает следующее:

: Если x = (x1 , . . . , xm ) - равновесие Нэша в некоторой игре, то ни одна из стратегий не может быть отброшена в результате применения процедуры последовательного отбрасывания строго доминируемых стратегий.

Если использовать только что введенные обозначения, то Теорема 151 утверждает, что если x - равновесие Нэша в исходной игре G, то на любом шаге t выполнено

xi Xi [t] , i I, t = 1, 2, . . .

x X[t] , t = 1, 2, . . .

Доказательство (Доказательство Теоремы 151 ): Пусть есть такой шаг τ , что на нем должна быть отброшена стратегия xi некоторого игрока i I . Предполагается, что на предыдущих шагах ни одна из стратегий не была отброшена:

x X[t] , t = 1, . . . , τ.

По определению строгого доминирования существует другая стратегия игрока i, x0 i Xi [τ] , которая дает этому игроку в игре G[τ] более высокий выигрыш при любых выборах других

ui (x0 i , x−i ) > ui (xi , x−i ) x−i X− [τ i ]

В том числе, это соотношение должно быть выполнено для x−i , поскольку мы предположили, что стратегии x−i не были отброшены на предыдущих шагах процедуры (x−i X− [τ i ] ). Значит,

: Если в результате последовательного отбрасывания строго доминируемых стратегий у каждого игрока остается единственная стратегия, xi , то x = (x1 , . . . , xm ) - равновесие Нэша в этой игре.

Данная теорема относится к случаю, когда в процессе отбрасывания строго доминируемых

стратегий начиная с некоторого шага ¯ остается единственный набор стратегий, т. е. t x

Теорема утверждает, что x является единственным равновесием Нэша исходной игры.

Доказательство (Доказательство Теоремы 152 ): Поскольку, согласно доказанной только что теореме, ни одно из равновесий Нэша не может быть отброшено, нам остается только доказать, что указанный набор стратегий x является равновесием Нэша. Предположим, что это не так. Это означает, что существует стратегия x˜i некоторого игрока i, такая что

ui (xi , x−i ) < ui (˜xi , x−i )

По предположению, стратегия x˜i была отброшена на некотором шаге τ , поскольку она не совпадает с xi . Таким образом, существует некоторая строго доминирующая ее стратегия x0 i Xi [τ] , так что

ui (x0 i , x−i ) > ui (˜xi , x−i ) x−i X− [τ i ]

В том числе это неравенство выполнено при x−i = x−i :

ui (x0 i , x−i ) > ui (˜xi , x−i )

Стратегия x0 i не может совпадать со стратегией xi , поскольку в этом случае вышеприведенные неравенства противоречат друг другу. В свою очередь, из этого следует, что должна существовать стратегия x00 i , которая доминирует стратегию x0 i на некотором шаге τ0 > τ , т. е.

(x00

[τ0 ]

−i

В том числе

ui (x00 i , x−i ) > ui (x0 i , x−i )

Можно опять утверждать, что стратегия x00 i не может совпадать со стратегией xi , иначе вышеприведенные неравенства противоречили бы друг другу.

Продолжая эти рассуждения, мы получим последовательность шагов τ < τ0 < τ00 < . . .

и соответствующих допустимых стратегий x0 i , x00 i , x000 i , . . ., не совпадающих с xi . Это противо-

/ 667. Два игрока размещают некоторый объект на плоскости, то есть выбирают его координаты (x, y). Игрок 1 находится в точке (x 1 , y1 ), а игрок 2 - в точке (x2 , y2 ). Игрок 1 выбирает координату x, а игрок 2 - координату y. Каждый стремиться, чтобы объект находился как можно ближе к нему. Покажите, что в этой игре у каждого игрока есть строго доминирующая стратегия.

/ 668. Докажите, что если в некоторой игре у каждого из игроков существует строго доминирующая стратегия, то эти стратегии составляют единственное равновесие Нэша.

/ 669. Объясните, почему равновесие в доминирующих стратегиях должно быть также равновесием в смысле Нэша. Приведите пример игры, в которой существует равновесие в доминирующих стратегиях, и, кроме того, существуют равновесия Нэша, не совпадающие с равновесием в доминирующих стратегиях.

Найдите в следующих играх все равновесия Нэша.

/ 670. Игра 16.2.1 (с.625 ), выигрыши которой представлены в Таблице??////??

/ 671. «Орехи»

Два игрока делят между собой 4 ореха. Каждый делает свою заявку на орехи: xi = 1, 2 или 3. Если x1 + x2 6 4, то каждый получает сколько просил, в противном случае оба не получают ничего.

/ 672. Два преподавателя экономического факультета пишут учебник. Качество учебника (q) зависит от их усилий (e1 и e2 соответственно) в соответствии с функцией

q = 2(e1 + e2 ).

Целевая функция каждого имеет вид

ui = q − ei ,

т. е. качество минус усилия. Можно выбрать усилия на уровне 1, 2 или 3.

/ 673. «Третий лишний» Каждый из трех игроков выбирает одну из сторон монеты: «орёл» или «решка». Если

выборы игроков совпали, то каждому выдается по 1 рублю. Если выбор одного из игроков отличается от выбора двух других, то он выплачивает им по 1 рублю.

/ 674. Три игрока выбирают одну из трех альтернатив: A, B или C . Альтернатива выбирается голосованием большинством голосов. Каждый из игроков голосует за одну и только за одну альтернативу. Если ни одна из альтернатив не наберет большинство, то будет выбрана альтернатива A. Выигрыши игроков в зависимости от выбранной альтернативы следующие:

u1 (A) = 2, u2 (A) = 0, u3 (A) = 1,

u1 (B) = 1, u2 (B) = 2, u3 (B) = 0,

u1 (C) = 0, u2 (C) = 1, u3 (C) = 2.

/ 675. Формируются два избирательных блока, которые будут претендовать на места в законодательном собрании города N-ска. Каждый из блоков может выбрать одну из трех ориентаций: «левая» (L), «правая» (R) и «экологическая» (E). Каждая из ориентаций может привлечь 50, 30 и 20% избирателей соответственно. Известно, что если интересующая их ориентация не представлена на выборах, то избиратели из соответствующей группы не будут голосовать. Если блоки выберут разные ориентации, то каждый получит соответствующую долю голосов. Если блоки выберут одну и ту же ориентацию, то голоса соответствующей группы избирателей разделятся поровну между ними. Цель каждого блока - получить наибольшее количество голосов.

/ 676. Два игрока размещают точку на плоскости. Один игрок выбирает абсциссу, другой -

ординату. Их выигрыши заданы функциями:

а) ux (x, y) = −x2 + x(y + a) + y2 , uy (x, y) = −y2 + y(x + b) + x2 ,

б) ux (x, y) = −x2 − 2ax(y + 1) + y2 , uy (x, y) = −y2 + 2by(x + 1) + x2 , в) ux (x, y) = −x − y/x + 1/2y2 , uy (x, y) = −y − x/y + 1/2x2 ,

(a, b - коэффициенты).

/ 677. «Мороженщики на пляже»

Два мороженщика в жаркий день продают на пляже мороженое. Пляж можно представить как единичный отрезок. Мороженщики выбирают, в каком месте пляжа им находиться, т. е. выбирают координату xi . Покупатели равномерно рассредоточены по пляжу и покупают мороженое у ближайшего к ним продавца. Если x1 < x2 , то первый обслуживают (x1 + x2 )/2 долю пляжа, а второй - 1 − (x1 + x2 )/2. Если мороженщики расположатся в одной и той же точке (x1 = x2 ), покупатели поровну распределятся между ними. Каждый мороженщик стремиться обслуживать как можно большую долю пляжа.

/ 678. «Аукцион» Рассмотрите аукцион, подобный описанному в Игре 16.2.2 , при условии, что выигравший

аукцион игрок платит названную им цену.

/ 679. Проанализируйте Игру 16.2.1 «Выбор компьютера» (с.624 ) и найдите ответы на следующие вопросы:

а) При каких условиях на параметры a, b и c будет существовать равновесие в доминирующих стратегиях? Каким будет это равновесие?

б) При каких условиях на параметры будет равновесием Нэша исход, когда оба выбирают IBM? Когда это равновесие единственно? Может ли оно являться также равновесием в доминирующих стратегиях?

/ 680. Каждый из двух соседей по подъезду выбирает, будет он подметать подъезд раз в неделю или нет. Пусть каждый оценивает выгоду для себя от двойной чистоты в a > 0 денежных единиц, выгоду от одинарной чистоты - в b > 0 единиц, от неубранного подъезда - в 0, а свои затраты на личное участие в уборке - в c > 0. При каких соотношениях между a, b и c в игре сложатся равновесия вида: (0) никто не убирает, (1) один убирает, (2) оба убирают?

/ 681. Предположим, что в некоторой игре двух игроков, каждый из которых имеет 2 стратегии, существует единственное равновесие Нэша. Покажите, что в этой игре хотя бы у одного из игроков есть доминирующая стратегия.

/ 682. Каждый из двух игроков (i = 1, 2) имеет по 3 стратегии: a, b, c и x, y, z соответственно. Взяв свое имя как бесконечную последовательность символов типа иваниваниван. . . , задайте выигрыши первого игрока так: u1 (a, x) = «и», u1 (a, y) = «в», u1 (a, z) = «а», u1 (b, x) = «н», u1 (b, y) = «и», u1 (b, z) = «в», u1 (c, x) = «а», u1 (c, y) = «н», u1 (c, z) = «и». Подставьте вместо каждой буквы имени ее номер в алфавите, для чего воспользуйтесь Таблицей16.10 . Аналогично используя фамилию, задайте выигрыши второго игрока, u2 (·).

1) Есть ли в Вашей игре доминирующие и строго доминирующие стратегии? Если есть, то образуют ли они равновесие в доминирующих стратегиях?

2) Каким будет результат последовательного отбрасывания строго доминируемых страте-

3) Найдите равновесия Нэша этой игры.

Таблица 16.10.

/ 683. Составьте по имени, фамилии и отчеству матричную игру трех игроков, у каждого из которых по 2 стратегии. Ответьте на вопросы предыдущей задачи.

/ 684. Заполните пропущенные выигрыши в следующей таблице так, чтобы в получившейся игре. . .

(0) не было ни одного равновесия Нэша,

было одно равновесие Нэша,

было два равновесия Нэша,

было три равновесия Нэша,

(4) было четыре равновесия Нэша.

/ 685. 1) Объясните, почему в любом равновесии Нэша выигрыш i-го игрока не может быть меньше, чем

min max ui (xi , x−i ).

x −iX −ix iX i

2) Объясните, почему в любом равновесии Нэша выигрыш i-го игрока не может быть

меньше, чем

x iX ix −iX −i

В результате освоения данной главы студент должен:

знать

  • определение равновесия по Нэшу (как в чистых, так и в смешанных стратегиях);
  • основные свойства равновесия по Нэшу;
  • теоремы, формулирующие условия существования равновесия по Нэшу в стратегических играх;
  • определение понятия "равновесие дрожащей руки";

уметь

Решать задачу нахождения равновесия по Нэшу в биматричных играх (в том числе графическим методом для игр);

владеть

  • простейшими методами анализа свойств биматричных игр 2 х 2 с использованием результатов их графического решения;
  • системой представлений как о возможностях, так и об объективных проблемах практического применения понятия равновесия по Нэшу;
  • терминологическим аппаратом, позволяющим самостоятельно осваивать научную и профессиональную литературу, использующую понятие равновесия но Нэшу и его свойства.

В данной главе мы рассмотрим основной объект исследования теории бескоалиционных игр, получивший название равновесия по Нэшу. Данное понятие было предложено выдающимся американским математиком Джоном Нэшем (John Forbes Nash) сначала в его диссертации, а затем в серии работ, вышедших в 1950-1953 гг. .

^ Ситуацию s* в игре Г = (I, {} i Î I , {(s)} i Î I) будем называть равновесием но Нэшу (в чистых стратегиях), если для любого игрока i Î I

Другими словами, ситуация равновесия по Нэшу - это такая ситуация в игре, от которой ни одному из игроков невыгодно отклоняться поодиночке (при условии что остальные участники игры придерживаются своих стратегий, образующих равновесие по Нэшу).

Рассмотрим отображения, которые для каждого игрока i Î I для каждой возможной подситуации Î ставят в соответствие некоторую стратегию , являющуюся его наилучшим ответом для данной подситуации:

Отображения возвращающие наилучшие ответы на подситуации, также называют отображениями отклика игрока. Из неравенства (3.1) следует, что ситуация равновесия по Нэшу образуется стратегиями, которые возвращаются отображениями отклика всех игроков, т.е. ситуация равновесия по Нэшу - это ситуация, образуемая наилучшими ответами каждого игрока на наилучшие ответы остальных:

В свою очередь, из условия (3.3) вытекают следующие свойства.

  • 1. Строго доминируемые стратегии и НЛО-стратегии не могут входить в равновесие по Нэшу.
  • 2. Стратегии, образующие равновесие по Нэшу, не могут быть исключены в процессе удаления строго доминируемых стратегий и рационализации игры.

Одновременно следует подчеркнуть, что слабо доминируемые стратегии перечисленными свойствами не обладают. Несложно сконструировать пример равновесия по Нэшу, в котором будут присутствовать одна или несколько слабодоминируемых стратегий.

Для рассмотрения свойств равновесия по Нэшу вернемся к игре "дилемма заключенного" (см. табл. 2.1).

Как нетрудно заметить, данная игра имеет единственное состояние равновесия по Нэшу. Это ситуация (С, С), в которой оба игрока сознаются и получают по пять лет тюремного наказания. Фундаментальным качеством ситуации (С, С) является именно то, что от нее действительно никому невыгодно отклоняться поодиночке. Если один из заключенных попытается сменить стратегию с "сознаться" на "молчать", то

этим он только ухудшит свое положение - вместо пяти лет наказания получит десять - и улучшит положение другого игрока, которого отпустят.

Нельзя не признать, что ситуация равновесия в данном примере является неэффективным исходом для заключенных. Ведь в ситуации (М, М) - оба молчат - их полезности выше (срок наказания составляет один год против пяти). Однако ситуация (М, М) обладает тем недостатком, что она неустойчива. В ней каждому из игроков выгодно сменить стратегию "молчать" на "сознаться", при условии что другой игрок продолжает придерживаться стратегии "молчать". В этом случае наказание для предавшего становится нулевым, правда, резко возрастает для преданного: с года до десяти.

Таким образом, дилемма заключенного достаточно ярко отражает тот факт, что

равновесие по Нэшу - необязательно "самая выгодная" ситуация для игроков, это устойчивая ситуация.

Также на примере дилеммы заключенного достаточно наглядно может быть продемонстрировано соотношение равновесия по Нэшу с таким фундаментальным понятием экономики, как оптимальность по Парето . Напомним, что

распределение называют оптимальным но Парето (Парето-оптимальным), когда полезность (благосостояние) ни одного из участников этого распределения не может быть увеличена без уменьшения полезности какого-либо другого участника.

Нетрудно заметить, что в дилемме заключенного ситуация равновесия но Нэшу является единственной Парето-неоптимальной: полезность участников "безболезненно для каждого из них" можно улучшить, перейдя от ситуации (С, С) к ситуации (М, М), но последняя не является равновесием по Нэшу в силу своей неустойчивости. С этой точки зрения дилемма заключенного является классическим примером, демонстрирующим различия между понятиями "равновесие по Нэшу" и "оптимальность по Парето".

Продемонстрируем возможности практического использования концепции равновесия по Нэшу на примере сюжетов из литературного приложения.

  • За свой вклад в теорию некооперативных игр Дж. Нэш в 1994 г. получил Нобелевскую премию по экономике
  • Введено итальянским экономистом и социологом Вильфредо Парето (1848-1923)

Равновесие Нэша (Nash equilibrium ) - это такая ситуация, при которой ни один из игроков не может увеличить свой выигрыш, в одностороннем порядке меняя свое решение. Другими словами, равновесие Нэша - это положение, при котром стратегия обеих игроков является наилучшей реакцией на действия своего оппонента

Равновесие Нэша в чистых стратегиях для стратегической игры - это такой профиль стратегий, что для всякого агента выполняется следующее условие:

Если в игре каждый из противников применяет только одну и ту же стратегию, то про саму игру в этом случае говорят, что она происходит в чистых стратегиях , а используемые игроком А и игроком В пара стратегий называются чистыми стратегиями .

Определение. В антогонистической игре пара стратегий (А i , В j) называется равновесной или устойчивой, если ни одному из игроков не выгодно отходить от своей стратегии.

Применять чистые стратегии имеет смысл тогда, когда игроки А и В располагают сведениями о действиях друг друга и достигнутых результатах. Если допустим, что хотя бы одна из сторон не знает о поведении противника, то идея равновесия нарушается, и игра ведется бессистемно.

33. Функция Неймана- Моргенштерна в теории игр. Равновесие Байеса-Нэша

Систематическая же математическая теория игр была детально разработана американскими учёными Дж. Нейманом и О. Моргенштерном (1944) как средство математического подхода к явлениям конкурентной экономики. В ходе своего развития И. т. переросла эти рамки и превратилась в общую математическую теорию конфликтов.

Основным в И. т. является понятие игры, являющееся формализованным представлением о конфликте. Точное описание конфликта в виде игры состоит поэтому в указании того, кто и как участвует в конфликте, каковы возможные исходы конфликта, а также кто и в какой форме заинтересован в этих исходах. Участвующие в конфликте стороны называются коалициями действия; доступные для них действия - их стратегиями; возможные исходы конфликта - ситуациями (обычно каждая ситуация понимается как результат выбора каждой из коалиций действия некоторой своей стратегии); стороны, заинтересованные в исходах конфликта, - коалициями интересов; их интересы описываются предпочтениями тех или иных ситуаций (эти предпочтения часто выражаются численными выигрышами). Конкретизация перечисленных объектов и связей между ними порождает разнообразные частные классы игр.

Определить оптимальную стратегию можно:

  • Равновесие Байеса-Нэша: если определено статистическое распределение встречаемого поведения (например, 33 % «око за око», 33 % всегда обманывают и 33 % всегда сотрудничают), то стратегию можно вычислить математически . Этим детально занимается теория эволюционной динамики.

Ученые вот уже почти шестьдесят лет используют теорию игр для расширения анализа стратегических решений, которые принимают фирмы, в частности для того, чтобы ответить на вопрос: почему на некоторых рынках фирмы стремятся сговориться, тогда как на других агрессивно конкурируют; использующие фирмы, чтобы не допустить вторжения потенциальных конкурентов; как должны приниматься решения о цене, когда меняются условия спроса или издержек или когда новые конкуренты вторгаются на рынок и т.

Первыми провели исследование в области теории игр Дж.-Ф. Нейман и О. Моргенштерн и описали результаты в книге "Теория игр и экономическое поведение" (1944). Они распространили математические категории этой теории на экономическую жизнь общества, введя понятие оптимальных стратегий, максимизации ожидаемой полезности, доминирование в игре (на рийку), коалиционных соглашений и тому подобное.

Ученые стремились сформулировать основополагающие критерии рационального поведения участника на рынке с целью достижения благоприятных результатов. Они различали две основные категории игр. Первая - "игра с нулевой суммой", предусматривающий такой выигрыш, который состоит исключительно из проигрыша других игроков. В связи с этим пользу одних непременно должна образовываться за счет потерь других игроков, так что общая сумма пользы и потерь всегда равна нулю. Вторая категория - "игра с плюсовой суммой", когда индивидуальные игроки соревнуются за выигрыш, состоящий из их же ставок. Иногда он образуется за счет наличия "выходного" (термин из карточной игры в бридж, который означает одного из игроков, который, делая ставку, не участвует в игре), совсем пассивного и часто является служащим объектом эксплуатации. В обоих случаях игра неизбежно сопряжена с риском, поскольку каждый из ее участников, как считали исследователи, "стремится максимально повысить функцию, переменные которой ним не контролируются". Если все игроки являются умелыми, то решающим фактором становится случайность. Но так бывает редко. Почти всегда важную роль в игре играет хитрость, с помощью которой делаются попытки раскрыть замыслы противников и завуалировать свои намерения, а затем занять выгодные позиции, которые заставили бы этих противников действовать в ущерб самим себе. Многое зависит и от "контрхитрости".

Большое значение во время игры имеет рациональное поведение игрока, т.е. продуманные выбор и осуществление оптимальной стратегии. Важный вклад в разработку формализованного (в виде моделей) описания конфликтных ситуаций, особенно в определении "формулы равновесия", т.е. устойчивости решений противников в игре, внес американский ученый Дж.-Ф. Нэш.

Нэш Джон Форбс родился в 1928 г.. (Г.. Влуефилд, США). Учился в университете Карнеги-Меллона по специальности инженера-химика, освоил курс "международная экономика". Получил диплом бакалавра и одновременно магистра математики.

В 1950 г.. В ИИриястонському университете защитил докторскую диссертацию на тему "некооперативных игры". Начиная с 1951г. И на протяжении почти восьми лет Нэш работал преподавателем Массачусетского технологического института, проводя одновременно активную научно-исследовательскую деятельность.

С весны 1959 ученый заболел и потерял работоспособность. В 70-е годы он смог вернуться к своим математических увлечений, однако производить научные результаты ему было трудно. Нобелевский комитет в 1994 фактически наградил труд, написанная в 1949

Член Национальной академии наук США, Бконометричного общества и Американской академии искусств и академии наук.

Досконально изучив различные игры, создав серию новых математических игр и наблюдая за действиями участников в различных игровых ситуациях, Нэш пытался глубже понять, как функционирует рынок, как компании принимают связаны с риском решения, почему покупатели действуют именно определенным образом. В экономике, как и в игре, руководители фирм должны учитывать не только последний, но и предыдущие шаги конкурентов, а также обстановку на всем экономическом (игровом, например, шахматном) поле и многие другие важные факторы.

Субъекты экономической жизни - активно действующие его участники, которые на рынке в условиях конкуренции идут на риск, и он должен быть оправдан. Поэтому каждый из них, как игрок, должен иметь свою стратегию. Именно это имел в виду Нэш, когда разрабатывал метод, который впоследствии назвали его именем (равновесие Нэша).

Свое понимание стратегии как основного понятия теории игр Дж.-Ф. Нэш разъясняет на основе "игры с нулевой суммой" (он называет это "симметричной игрой"), когда каждый участник имеет определенное число стратегий. Выигрыш каждого игрока зависит от того, какие стратегии выбрал и он, и его противник. На основании этого строится матрица для нахождения оптимальной стратегии, которая за многократного повторения игры обеспечивает этому игроку максимально возможный средний выигрыш (или максимально возможный средний проигрыш). Поскольку игроку неизвестно, какую стратегию выберет противник, ему самому лучше (рационально) выбрать стратегию, которая рассчитана на худшую для него поведение противнике (принцип так называемого "гарантированного результата"). Действуя осторожно и считая противника сильным конкурентом, наш игрок выберет для каждой своей стратегии минимально возможный выигрыш. Затем из всех минимально выигрышных стратегий он выберет такую, которая обеспечит максимальный из всех минимальных выигрыш - максимин.

Но и противник, вероятно, подумает аналогично. Он найдет для себя наибольшие проигрыши во всех стратегиях игрока, а затем из этих максимальных проигрышей выберет минимальный - минимакс. В случае равенства максимина мини Максу решения игроков будут устойчивыми, а игра будет иметь равновесие. Устойчивость (равновесие) решений (стратегий) состоит в том, что отходить от выбранных стратегий будет невыгодно для обоих участников игры. В случае, когда максимин не равна минимакса, решения (стратегии) обоих игроков, если они сколько-нибудь угадали выбор стратегии противника, оказываются неустойчивыми, невривно-важен.

Общее краткое определение равновесия Нэша - результат, в котором стратегия каждого из игроков является лучшей среди других, принятых остальными участниками игры стратегий. Это определение основывается на том, что ни один из игроков изменением собственной роли не может достичь наибольшей пользы (максимизации функции полезности), если остальные участники твердо придерживаются своей линии поведения.

Свою формулу равновесия Дж.-Ф. Нэш многократно усилил, включив в нее как незаменимый фактор для выработки стратегий показатель оптимального объема информации. Этот показатель оптимальности он вывел из анализа ситуаций (1) с полным информированием игрока о своих противников и (2) с неполным информированием о них. Переведя этот постулат с математического языка на язык экономической, Нэш ввел неуправляемые переменные рыночных отношений как важный информационный элемент знания условий внешней среды. После этого равновесие Нэша стала методом, используется практически во всех отраслях экономической науки для лучшего понимания сложных взаимосвязей, - отметил в октябре 1994 во время объявления новых лауреатов Нобелевской премии по экономике А. Линдбек, член Шведской королевской академии и председатель Нобелевского комитета по экономике.

Применение равновесия Нэша стало важным шагом в микроэкономике. ее использование способствовало углубленному пониманию развития и функционирования рынков, обоснованию стратегических решений, принимаемых менеджерами различных фирм. Равновесием Нэша можно пользоваться при изучении процесса ведения политических переговоров и экономического поведения, в том числе на олигополистических рынках.

По пионерной анализ равновесия в некооперативных играх Нобелевская премия по экономике 1994 года было присуждена Дж.-Ф. Нэш в, Р. Селтену и Дж. Харшани. Начиная с классического труда Дж. Неймана и О. Моргенштер-на "Теория игр и экономическое поведение", неотъемлемой частью экономического анализа стало исследование стратегии взаимодействия экономических субъектов в условиях, когда для выработки собственной линии поведения необходимо учитывать действия другого суб " объекта (как это происходит, в частности, в шахматах, преферансе и других играх). Эти трое Нобелевских лауреатов внесли большой вклад в ответвление теории игр - теорию некооперативных игр (то есть игр, когда достигнута договоренность между участниками). Принципиальным моментом этой теории является концепция равновесия, используется для предсказания результатов взаимодействия.

Равновесие Нэша стала фундаментальным понятием теории игр.

Анализ дискретного выбора

К последней четверти ХХ в. доминировало мнение, что основную роль в поведении потребителей играют здравый смысл и расчет. Именно с учетом прежде всего здравого смысла потребителей сформулированы либеральные экономические теории. Экономисты этого научного направления считают, что рынок как система отношений между экономическими субъектами способен саморегулироваться и устанавливать справедливые цены на товары и услуги на основе здравого смысла.

Хотя либеральная экономическая школа дала миру больше научных достижений, чем конкурентная консервативна, однако ее теории имеют ограниченное применение, что признают и ее сторонники. Например, монетарнсты (они же либералы) пока не сумели аргументированно объяснить поведение инвесторов на международных финансовых рынках и огромные колебания цен на мировые сырьевые ресурсы.

Либеральный рыночный подход оказался слишком упрощенным для надежного прогнозирования потребительского спроса на услуги и товары в условиях, когда потребители имеют огромный выбор подобных товаров и при этом не ограничены в объемах закупок, поскольку сейчас в развитых странах чрезвычайно распространен потребительский кредит. Кроме того, либеральная теория не может объяснить, например, покупку американской семьей (или английском семьей) американского (или английского) автомобиля, в то время как корейский стоит дешевле. То есть эта теория не принимает во внимание национальные и другие особенности поведения потребителей, которые с точки зрения здравого смысла трудно объяснить.

Поэтому в последнее время ученые-екоярмисты все чаще говорят о появлении новой экономической теории, сложившейся непосредственно на основе данных о поведении потребителей, которую надо изучать с помощью статистических методов. Эта теория предлагает описание способа измерения полезности. Несмотря на то, что подобные оценки носят субъективный характер, именно субъективность определяет их ценность для реализации экономической политики. Многие экономисты даже прогнозируют, что именно теория поведения потребителей (известный автор - Д. - Л. Мак-Федден) будет в XXI в. основой для определения экономической и политической стратегии развитых государств.

Мак-Федден ДаниельЛитл родился в 1937г. (г.. Ралейг, штатГОвн.Каролина, США). Учился и работал в Миннесотского университете. В 1962 г.. Защитил докторскую диссертацию, работал ассистентом профессора экономики в Питсбургском университете, затем профессором экономики в Калифорнийском университете, где с 1991 г.. Руководит эконометрической лабораторией.

Опубликовал в соавторстве такие труды: "Очерки об экономическом поведении в условиях нестабильности" (1974), "Спрос на городское передвижения: поведенческий анализ" (1976), "Экономика производства: двойной подход к теории и практики" (1978), "Структурный анализ дискретных данных с економетричяимы приложениями "(1981)," Мик-роекономичне моделирования и численный анализ: исследование спроса в коммунальном хозяйстве "(1984)," Справочник по эконометрики "(т.4,1994), а также много научных статей.

В течение 1983-1984 гг. Был вице-президентом, а в 1985 г.. - Президентом Эконометрического общества. У1994 г.. Избирался вице-президентом Американской экономической ассоциации. Член Национальной академии наук США, Американских эконометрического общества и академий искусств и наук, Американская экономическая ассоциация наградила его медалью Дж.-Б. Кларка, Эконометрическое общество - медалью Р. Фриша.

Известно, что довольно часто микроданные отражают дискретные выборы - выборы среди конечного множества альтернативных решений. В экономической теории традиционный анализ спроса предусматривал, что индивидуальный выбор должен быть представлен непрерывной переменной, но такая трактовка не соответствует изучению поведения дискретного выбора. Предыдущими достижениями многих ученых эмпирические исследования таких выборов не были обоснованными в экономической теории.

Методология анализа дискретного выбора Д.-л. Мак-Феддена коренится в микроэкономической теории, согласно которой каждый индивид выбирает определенную альтернативу, которая максимизирует его полезность. Функции полезности - это способы описания потребительского выбора: если выбран набор услуг X при том, что набор услуг В доступен, то X должен иметь большую полезность, чем В. Изучая выбор, сделанный потребителями, можно вывести оценочную функцию полезности, адекватно описывала бы их поведение. Очевидно, что невозможно исследовать весь комплекс фактов влияния на выбор индивида, но анализ динамики изменений среди личностей с примерно одинаковыми характеристиками позволяет сделать достаточно объективные выводы.

Д.-л. Мак-Федден в сотрудничестве с Т, Домеником изучил поведение потребителей относительно регулярных транспортных поиздок1. В большинстве крупных городов у лиц, осуществляющих регулярные транспортные поездки, есть выбор: пользоваться общественным транспортом или ездить на работу автомобилем. Каждую из этих альтернатив можно рассматривать как набор различных характеристик: время нахождения в пути, время ожидания, имеющихся расходов, комфорта, удобства и тому подобное. Таким образом, можно обозначить продолжительность времени нахождения в пути для каждого рода поездки через х {, продолжительность времени ожидания для каждого вида поездки через х 2 и т. Д.

Если (хх, х2, Хя) представляет значение п различных характеристик автомобильных поездок, а (y1, y2 ... .. y п) - значения характеристик поездок на автобусе, то можно рассмотреть модель, в которой потребитель принимает решение о том, поехать ему автомобилем или автобусом, исходя из предпочтения одного набора указанных характеристик другому. Конкретнее можно предположить, что преимущества среднего потребителя в отношении указанных характеристик могут быть представлены функцией полезности вида:

где коэффициенты b и, b 2 i т. Д - неизвестные параметры. Любое монотонное преобразование этой функции полезности может описать потребительский выбор, однако с точки зрения статистики работать с линейной функцией значительно легче.

Предположим, что существует группа похожих по характеристикам потребителей, которые выбирают, поехать автомобилем или автобусом, основываясь при этом на конкретных данных о продолжительности времени поездок, о расходах и другие характеристики поездок, с которыми они сталкиваются. В статистике есть технические приемы, которые можно использовать для поиска значений коэффициентов Д, при и - 1, п, наиболее подходящие для исследовательской структуры выбора, осуществленного данной множественностью потребителей. Эти технические приемы статистики позволяют вывести оценочную функцию полезности для различных способов транспортного передвижения.

Мак-Федден и Доменик предложили функцию полезности вида:

где ТW - общее время ходьбы до автобуса или автомобиля или от него; ТТ - общее время поездки в минутах; С - общая стоимость поездки в долларах.

С помощью оценочной функции полезности удалось правильно описать выбор между автомобильным и автобусным транспортом для 93% домохозяйств взятой авторами выборки. Коэффициенты при переменных в изложенном уравнении показывают предельную полезность каждой такой характеристики. Отношение одного коэффициента к другому показывает предельную норму замещения одной характеристики другой. Например, отношение предельной полезности времени ходьбы пешком к предельной полезности общей продолжительности поездки указывает не то, что рядовой потребитель считает время ходьбы пешком примерно в 3 раза медленнее, чем время поездки. То есть потребитель был бы готов затратить 3 дополнительных минуты на поездку, чтобы сэкономить 1 минуту ходьбы пешком. Аналогично отношение стоимости поездки в общей продолжительности поездки указывает на выбор рядового потребителя относительно этих двух переменных. В исследовании рядовой пассажир оценивал минуту времени поездки на транспорте в 0,0411 х х 2,24 = 0,0183 долл. за минуту, что составляет 1,10 долл. в час. (Для сравнения - часовая зарплата среднего пассажира в 1967 г.. Составляла в сена 2,85 долл. В час.)

Такие оценочные функции полезности могут быть ценными для определения того, следует осуществлять какие-то изменения в системе общественного транспорта. Например, в приведенной выше функции полезности одним из важных факторов, объясняющих, чем руководствуются потребители в своем выборе, является продолжительность поездки. Городское управление транспортом могло бы при небольших затратах увеличить количество автобусов, чтобы сократить эту общую продолжительность поездки, но необходимо выяснить дополнительное количество пассажиров оправдает рост затрат.

Оперируя функцией полезности и выборке потребителей, можно сделать прогноз относительно того, какие потребители захотят совершать поездки автомобилем, а какие предпочтут автобуса. Это позволит получить некоторое представление о том, будет ли выручка достаточной для покрытия дополнительных расходов. Кроме того, можно использовать предельную норму замещения для формирования представления об оценке каждым потребителем сокращения времени поездок. По результатам исследования Мак-Феддена и Доменика рядовой пассажир в 1967 оценивал время поездки по ставке 1,10 долл. в час, он готов был заплатить 37 центов, чтобы сократить время поездки на 20 минут. Это число показывает степень выигрыша в долларах от более своевременного предоставления автобусных услуг. Наличие количественной меры выигрыша, безусловно, способствует принятию рациональных решений в сфере транспортной политики.

Еще один весомый вклад Мак-Феддена - это развитие в 1974 так называемого анализа условного логит. Модель предполагает, что каждый человек в жизни находится перед рядом альтернатив. Обозначим как X характеристики, связанные с каждой альтернативой, и как 2 характеристики лиц, исследователь может наблюдать с помощью имеющихся данных. Например, для изучения выбора способа путешествий, где альтернативой может быть автомобиль, автобус или метро, X может включать информацию относительно времени и расходов, тогда как X мог бы включать данные относительно возраста, дохода и образования. Но различия между индивидами и альтернативы папке, как между Х \%, хотя они незаметны исследователю, но именно они определяют индивидуальный максимально полезный выбор. Такие характеристики представлены случайными векторами ошибок. Мак-Федден предположил, что эти случайные ошибки имеют определенную статистическую дистрибуцию (распределение) среди населения, назвав ее дистрибуцией экстремального значения. В этих условиях (плюс некоторые технические предсказания) он продемонстрировал, что вероятность того, что лицо и выберет альтернативу /, может быть записана в виде многочленов логит-модели:

где e - основание натурального логарифма; b и b - параметры (векторы). В своей базе данных исследователь может наблюдать переменные X и Z фактически так, как индивид выбирает альтернативу. В результате ученый способен оценить параметры р и <5, использовав известные статистические методы. Мак-Федденивське дифференцировки логит-модели осталось новацией и признается фундаментальным достижением.

Модели обычно используются в исследованиях спроса на городские перевозки. Они также могут применяться на транспорте, когда планируется изучить эффективность политических мер, а также социальных реформ или изменений окружающей среды. Например * эти модели могут объяснить, как изменения в цене товаров улучшают их доступность, влияют они на демографическую ситуацию, на объемы путешествия, используя альтернативные способы передвижения. Модели также приемлемые для многих других сфер, в частности, в исследованиях выбора жилого помещения, места жительства или образования. Мак-Федден использовал разработанные методы для анализа многих социальных проблем, таких как спрос на бытовую энергию, телефонные услуги и обеспечение жильем людей пожилого возраста и тому подобное.

В результате своих исследований ученый пришел к выводу, что условные логит-модели имеют определенную особенность относительно вероятности выбора между двумя альтернативами, например путешествия автобусом или поездом, независимыми от цены других вариантов передвижения. Эта особенность, названная независимостью несвязанных альтернатив (ННА), нереалистично для статистического потребления. Д.-л. Мак-Федден изобрел не только статистические тесты для установления соответствия ННА, но и предложил общие модели, названные заключенным логит-моделями, которые предусматривают, что выборы индивидов могут быть сделаны в определенной последовательности. Например, при исследовании решений, касающихся места жительства и типа жилья, принято, что гражданин сначала выбирает микрорайон, а затем - тип жилого помещения.

Даже с этими обобщениями модели весьма чувствительны к определенным предсказаний относительно дистрибуции ненаблюдаемых характеристик среди населения. В течение последнего десятилетия Д.-л. Мак-Федден разработал имитационные модели (методы моделируемых моментов) для статистической оценки дискретного выбора моделей, которые допускают гораздо более основных предположений. Мощные компьютеры расширили практическую приспособленность этих численных методов. В результате дискретные выборы индивидов теперь могут быть описаны более реалистично, а их решения - предусмотрены точнее. На основе своей новой теории Мак-Федден разработал микроеконометрични модели, которые могут использоваться, например, для предсказания намерений той части населения, которая будет выбирать различные альтернативы. За развитие методики формального обработки индивидуальных статистических и экономических данных Мак-Феддена отмечено Нобелевской премией.

Д.-л. Мак-Федден в 60-е годы также изобрел эконометрические методы оценки производственной технологии и исследовал факторы, косвенно влияют на потребность фирмы в капитале и в рабочей силе. В течение 90-х лет талантливый ученый научно развил экономику природопользования, обогатил методическую литературу по оценке стоимости природных богатств, в частности исследовал потери общественного богатства вследствие нанесенных в 1989 г.. Убытков окружающей среде нефтяным пятном, движущейся от пострадавшего в аварии танкера "Exxon Valdez * вдоль побережья Аляски.

Лейтмотивом исследований профессора Д.-л. Мак-Феддена е попытки объединить экономическую теорию, статистические и эмпирические методы для решения с их помощью социальных проблем. Его научные разработки также помогают социологам и политикам оценить выбор голосующих, исходя из змьн в их доходах и др.

Мак-Федден первым предложил методологию анализа дискретного выбора, согласно которой каждый индивид выбирает определенную альтернативу, которая максимизирует его полезность. Функции полезности представляют собой способы описания потребительского выбора. Изучая выбор, сделанный потребителями, можно вывести оценочную функцию полезности, адекватно описывала бы их поведение.

На протяжении всей жизни человек вынужден принимать определённые решения по самым разнообразным вопросам, начиная от бытовых споров - кто будет убирать комнаты в доме или как благоустроить свой город, и заканчивая международными переговорами, многомиллионными аукционами и даже военными действиями. И во всех этих ситуациях человек стремится максимизировать свой собственный выигрыш. Но при этом ему всегда приходится выбирать: сотрудничать с другими людьми или думать только о своей выгоде, не заботясь о выгоде других. Классическим примером, который показывает, что в погоне за личной выгодой не всегда можно достичь лучшего результата, выступает «Дилемма заключённого».

Двое заключённых А и Б подозреваются в совершении преступления, за которое им грозит до 10 лет лишения свободы. Но прямых улик пока нет. Поэтому следствие предлагает каждому из заключённых пойти на сделку - признаться в содеянном и свалить инициативу преступления на другого. Если один признается, а другой заключённый будет хранить молчание, то первому уменьшат срок заключения до трёх лет за содействие следствию, а второго посадят на 10 лет.

Если оба пойдут на сделку со следствием и сознаются в содеянном, то каждый получит по 5 лет. Однако, если оба будут молчать, то за отсутствием улик, их выпустят на свободу. Заключённые находятся в разных камерах, чтобы они не могли сговориться друг с другом и согласовать своё поведение на допросе. Ни один из них не знает точно, что сделает другой. Какое решение примет каждый из них? Что произойдёт?

У каждого заключённого есть выбор: молчать или признаться. Это и есть дилемма заключённого: должен ли он оговорить другого или должен попытать удачу и не признаваться, сильно при этом рискуя? В зависимости от выбора заключённых в этой ситуации возможны четыре исхода.

Рассмотрим их:

1. Если оба заключённых дают признательные показания, каждый из них получает по пять лет тюрьмы;

2. Если заключённый А будет хранить молчание, а заключённый Б даст показания против него, то первый сядет на 10 лет, а второй - на три года;

3. И наоборот, если заключённый А признается, а заключённый Б будет хранить молчание, то первый сядет на три года, а второй - на 10 лет;

4. А если оба будут молчать, то за отсутствием улик из выпустят на свободу.

Какой из этих исходов наиболее реален? Чтобы ответить на этот вопрос, нужно знать, как рассуждает каждый из них. Вот как рассуждает заключённый А:

« Допустим, что заключённый Б признается. Если я тоже признаюсь, то получу 5 лет. Если же буду молчать - получу 10 лет. Значит, если заключённый Б признается, мне тоже лучше признаться в содеянном.

Если же заключённый Б будет хранить молчание, как следует поступить мне? Если признаюсь - получу 3 года. А если тоже буду молчать, то выйду на свободу. Это, конечно, идеальный вариант, но я не уверен, что заключённый Б будет молчать, я ему не доверяю. Поэтому мне лучше дать показания.

Значит, что бы ни делал заключённый Б, мне лучше признаться».

Ход рассуждений заключённого Б аналогичный, и он также приходит к выводу, что для него выгоднее признаться, независимо от того, что будет делать заключённый А.

Что же получается? Каждый из заключённых выбрал стратегию, которая, хотя и не приводит к самому лучшему результату (выходу на свободу), но является наилучшей для каждого из них при любом поведении соперника. Так как цель каждого заключённого - минимизировать свой срок заключения, не заботясь о другом заключённом, то признаться и оговорить другого - наиболее выгодная стратегия для каждого из них. Проще говоря, не важно, что сделает другой, каждый выиграет больше, если предаст. Поэтому заключённые выберут стратегию «Признаться» и получат по 5 лет тюрьмы.

Итак, на этом примере мы увидели, что решение, принимаемое одним игроком, влияет на решение другого (и наоборот) и в итоге влияет на конечный исход игры.

Другими примерами игр, в которых участвуют люди с несовпадающими (противоположными) целями, когда результат зависит от решений всех участников, могут послужить игра в покер, шахматы, пенальти в футболе и многие другие игры.

Но, наряду с традиционными играми, между людьми существуют и такие серьёзные отношения как рыночная конкуренция, гонка вооружений, загрязнение окружающей среды, выборы, торговля и др. Например, компании, конкурирующие на рынке, при принятии решений должны оглядываться на действия конкурентов. Или другой показательный пример - гонка вооружений между Советским Союзом и США в 1950-1990-х годах. В течение почти полувека две великие страны тратили много денег на вооружение, не отставая друг от друга. Если бы между ними было доверие, они бы не тратили столько средств на вооружение, а потратили бы их с бо льшей пользой (на образование, здравоохранение, пенсии и т. п.) и обе стороны выиграли бы от этого. Но вместо этого каждая страна, не доверяя другой, продолжала производить оружие и никто от этого не выигрывал.

Все эти серьёзные отношения тоже называют играми, поскольку в них, как и в обычных играх, результат зависит от решений (стратегий) всех участников. А наука, которая изучает эти серьёзные отношения, называется теорией игр. Поэтому слово «игра» в данном случае не должно вводить вас в смятение. Это понятие в теории игр трактуется шире, чем в повседневной жизни.

Равновесие Нэша

Итак, в «Дилемме заключённого» ситуация складывается таким образом, что, поступая по отдельности рационально и разумно, в итоге заключённые получают по пять лет тюрьмы. Однако, как мы уже отметили, это не самый оптимальный исход. Есть вариант и получше: выйти на свободу, если оба будут молчать.

Наверняка каждый из заключённых, когда принимал решение, рассуждал так: «Если мы оба будем молчать, то выйдем на свободу. Конечно, это лучше, чем сесть на пять лет. Но где гарантия, что второй тоже будет молчать? Ведь если я буду молчать, а другой даст показания, то я сяду на целых 10 лет! Нет, уж лучше я признаюсь в содеянном».

Очевидно, что взаимное недоверие друг к другу не позволяет реализоваться ситуации, когда каждый выйдет на свободу. К тому же заключённые сидят в разных камерах и каждый принимает решение, не зная о решении другого и у каждого есть соблазн дать показания против другого и получить 3 года вместо 5 или 10 лет. Получается, что самый лучший исход - выйти на свободу - является ненадёжным и нестабильным. Именно поэтому заключённые выбрали такие стратегии, которые привели пусть не к самому лучшему исходу, но зато надёжному и исключающему риск обмана и предательства. Такой исход называется равновесием Нэша.

Равновесие Нэша (Nash equilibrium ) - это такая комбинация стратегий игроков и их выигрышей, при которой ни один из игроков не может увеличить свой выигрыш, изменив свою стратегию, если при этом другие участники своих стратегий не меняют. Примечание: равновесие Нэша существует в играх, в которых игроки действуют независимо друг от друга и не могут объединяться и координировать свои действия.

Простыми словами, равновесие Нэша - это такая ситуация, когда стратегия каждого игрока является наилучшей реакцией на стратегии других игроков и ни одному игроку невыгодно в отдельности менять свою стратегию.

Равновесие Нэша - это не самый лучший исход из всех возможных, но в ситуации, когда каждый играет сам за себя, это оптимальный исход для каждого игрока, потому что сводятся к нулю риски и потери каждого игрока, которые могли бы быть, если другой игрок решит его обмануть или предать.

Равновесие Нэша - это устойчивое равновесие, потому что игрокам выгодно его сохранять, так как любое изменение ухудшит их положение. Но если в отношениях между игроками появляется сотрудничество, равновесие Нэша перестаёт быть равновесным, потому что появляется возможность достичь более лучшего результата. Например, если бы в «Дилемме заключённого» у игроков была возможность договориться о сотрудничестве, а именно - вдвоём хранить молчание, либо, если бы у них не было сомнений в том, что другой не предаст и тоже будет молчать, то ситуация могла бы закончиться для обоих с более лучшим исходом - выходом на свободу.

Вывод: Равновесие Нэша показывает, что каждый игрок может выиграть больше, если между игроками будут существовать сотрудничество, доверие и честность, и каждый игрок, делая лучше для других, сделает лучше для себя.

Иллюстрация с сайта postnauka.com