Agentes em Competição e o Jogo da Minoria
Available from
Rafael Calsaverini's profile on Mendeley.
Page 1
Agentes em Competição e o Jogo da Minoria
Agentes em Competic~ao e o Jogo da Minoria
Rafael S. Calsaverini
IF-USP
Este trabalho contem uma pequena revis~ao sobre a origem do Jogo da Minoria como modelo
para descrever sistemas de agentes em competic~ao por recursos escassos, uma soluc~ao aproximada
desse modelo no limite de tempo contnuo atraves do ansatz de replica simetrica da hamiltoniana de
pseudo-equilibrio, e uma discuss~ao sobre as suas propriedades. S~ao tambem apresentadas ao nal
possveis generalizac~oes do modelo e indicac~oes de melhores metodos de soluc~ao.
Contents
I. Introduc~ao - O modelo de El Farol 1
II. Apresentac~ao formal do modelo: o Jogo da
Minoria 2
III. Fenomenologia do Jogo da Minoria 2
IV. Especializac~ao para o caso S=2 e limite de
tempo contnuo 4
A. Decision Noise 5
B. Tempo contnuo e equac~ao mestra 5
C. Expans~ao de Kramers-Moyal, equac~ao de
Fokker-Planck 6
V. Soluc~ao Aproximada 6
A. Pseudo-equilbrio 6
B. Meca^nica Estatstica 7
C. Media sobre a desordem: replicas 7
D. Ansatz Replica-Simetrico 8
Refere^ncias 8
I. INTRODUC ~AO - O MODELO DE EL FAROL
qO programa de pesquisa da Meca^nica Estatstica con-
siste em relacionar sistematicamente o comportamento
coletivo de um sistema de muitos \agentes" (moleculas,
spins, campos, ...) as suas leis de comportamento mi-
croscopico. O sucesso da aplicac~ao desse programa a sis-
temas fsicos motiva a aplicac~ao do mesmo conjunto de
ideias em outras areas em que observa-se padr~oes coleti-
vos de comportamento: neurocie^ncia, ecologia, economia,
cie^ncias sociais, etc. Um problema de interesse para esse
nicho de pesquisa e compreender a organizac~ao da ex-
plorac~ao de recursos escassos por agentes que competem
entre si, problemas que foram tradicionalmente ataca-
dos atraves da disciplina matematica denominada Teoria
dos Jogos, a teoria de escolha de estrategias por agen-
tes racionais atraves da maximizac~ao de alguma func~ao
Electronic address: rafael.calsaverini@gmail.com
utilidade. Entretanto, jogos estaticos com jogadores per-
feitamente racionais n~ao se aproximam de situac~oes reais,
em que ha limitac~ao na informac~ao disponvel a cada jo-
gador e limitac~oes de sua capacidade de processamento
de informac~ao, situac~oes que s~ao coletivamente chamadas
de racionalidade limitada.
Um dos primeiros modelos quantitativos simples com
agentes com racionalidade limitada foi o problema de El
Farol[1, 4]. O modelo e inspirado em um restaurante
denominado El Farol, cujas mesas s~ao muito disputa-
das em certos dias da semana em que ha eventos mu-
sicais. O modelo consiste em N agentes que frequen-
tam um restaurante com uma capacidade para acomodar
confortavelmente L < N pessoas. A cada dia os agen-
tes devem decidir entre ir ou n~ao jantar no restaurante
El Farol [7]. Se o restaurante ultrapassa sua lotac~ao, e
mais agradavel para os agentes permanecer em casa. Se
a lotac~ao n~ao e atingida, e mais agradavel ir ao restau-
rante. Cada agente deve, portanto, tomar a decis~ao de
ir ou n~ao baseando-se em sua expectativa de qual sera a
decis~ao dos outros agentes. Cada agente cria uma serie
um modelo para o comportamento de seus pares para de-
cidir se vai ou n~ao a El Farol e, caso seu modelo seja bem
sucedido e seja capaz de prever corretamente o compor-
tamento dos outros, o agente o mantera, caso contrario,
o adaptara ao longo do tempo.
Ve^-se claramente que n~ao ha uma melhor soluc~ao ra-
cional para os agentes nesse problema. Se houvesse uma
melhor soluc~ao, cada agente a escolheria e tomaria a
mesma decis~ao (ir ou n~ao ir) tornando a soluc~ao desa-
gradavel. Dessa forma o modelo apresenta uma serie de
caractersticas interessantes para a pesquisa em modela-
gem de sistemas sociais e econo^micos:
elevado grau de frustrac~ao: se a maioria dos agentes
acredita que poucos ir~ao ao bar, muitos decidir~ao
ir e a noite lhes sera desagradavel;
racionalidade limitada: uma vez que n~ao ha soluc~ao
objetiva, cada agente age de maneira indutiva, cri-
ando modelos e os melhorando, em oposic~ao aos jo-
gos dedutivos, onde cada agente tem acesso a todo
o espaco de possveis estrategias e tenta minimizar
uma func~ao utilidade;
os agentes decidem segundo suas crencas subjetivas
sobre outras crencas subjetivas, se aproximando as-
sim do comportamento dos agentes nanceiros se-
Rafael S. Calsaverini
IF-USP
Este trabalho contem uma pequena revis~ao sobre a origem do Jogo da Minoria como modelo
para descrever sistemas de agentes em competic~ao por recursos escassos, uma soluc~ao aproximada
desse modelo no limite de tempo contnuo atraves do ansatz de replica simetrica da hamiltoniana de
pseudo-equilibrio, e uma discuss~ao sobre as suas propriedades. S~ao tambem apresentadas ao nal
possveis generalizac~oes do modelo e indicac~oes de melhores metodos de soluc~ao.
Contents
I. Introduc~ao - O modelo de El Farol 1
II. Apresentac~ao formal do modelo: o Jogo da
Minoria 2
III. Fenomenologia do Jogo da Minoria 2
IV. Especializac~ao para o caso S=2 e limite de
tempo contnuo 4
A. Decision Noise 5
B. Tempo contnuo e equac~ao mestra 5
C. Expans~ao de Kramers-Moyal, equac~ao de
Fokker-Planck 6
V. Soluc~ao Aproximada 6
A. Pseudo-equilbrio 6
B. Meca^nica Estatstica 7
C. Media sobre a desordem: replicas 7
D. Ansatz Replica-Simetrico 8
Refere^ncias 8
I. INTRODUC ~AO - O MODELO DE EL FAROL
qO programa de pesquisa da Meca^nica Estatstica con-
siste em relacionar sistematicamente o comportamento
coletivo de um sistema de muitos \agentes" (moleculas,
spins, campos, ...) as suas leis de comportamento mi-
croscopico. O sucesso da aplicac~ao desse programa a sis-
temas fsicos motiva a aplicac~ao do mesmo conjunto de
ideias em outras areas em que observa-se padr~oes coleti-
vos de comportamento: neurocie^ncia, ecologia, economia,
cie^ncias sociais, etc. Um problema de interesse para esse
nicho de pesquisa e compreender a organizac~ao da ex-
plorac~ao de recursos escassos por agentes que competem
entre si, problemas que foram tradicionalmente ataca-
dos atraves da disciplina matematica denominada Teoria
dos Jogos, a teoria de escolha de estrategias por agen-
tes racionais atraves da maximizac~ao de alguma func~ao
Electronic address: rafael.calsaverini@gmail.com
utilidade. Entretanto, jogos estaticos com jogadores per-
feitamente racionais n~ao se aproximam de situac~oes reais,
em que ha limitac~ao na informac~ao disponvel a cada jo-
gador e limitac~oes de sua capacidade de processamento
de informac~ao, situac~oes que s~ao coletivamente chamadas
de racionalidade limitada.
Um dos primeiros modelos quantitativos simples com
agentes com racionalidade limitada foi o problema de El
Farol[1, 4]. O modelo e inspirado em um restaurante
denominado El Farol, cujas mesas s~ao muito disputa-
das em certos dias da semana em que ha eventos mu-
sicais. O modelo consiste em N agentes que frequen-
tam um restaurante com uma capacidade para acomodar
confortavelmente L < N pessoas. A cada dia os agen-
tes devem decidir entre ir ou n~ao jantar no restaurante
El Farol [7]. Se o restaurante ultrapassa sua lotac~ao, e
mais agradavel para os agentes permanecer em casa. Se
a lotac~ao n~ao e atingida, e mais agradavel ir ao restau-
rante. Cada agente deve, portanto, tomar a decis~ao de
ir ou n~ao baseando-se em sua expectativa de qual sera a
decis~ao dos outros agentes. Cada agente cria uma serie
um modelo para o comportamento de seus pares para de-
cidir se vai ou n~ao a El Farol e, caso seu modelo seja bem
sucedido e seja capaz de prever corretamente o compor-
tamento dos outros, o agente o mantera, caso contrario,
o adaptara ao longo do tempo.
Ve^-se claramente que n~ao ha uma melhor soluc~ao ra-
cional para os agentes nesse problema. Se houvesse uma
melhor soluc~ao, cada agente a escolheria e tomaria a
mesma decis~ao (ir ou n~ao ir) tornando a soluc~ao desa-
gradavel. Dessa forma o modelo apresenta uma serie de
caractersticas interessantes para a pesquisa em modela-
gem de sistemas sociais e econo^micos:
elevado grau de frustrac~ao: se a maioria dos agentes
acredita que poucos ir~ao ao bar, muitos decidir~ao
ir e a noite lhes sera desagradavel;
racionalidade limitada: uma vez que n~ao ha soluc~ao
objetiva, cada agente age de maneira indutiva, cri-
ando modelos e os melhorando, em oposic~ao aos jo-
gos dedutivos, onde cada agente tem acesso a todo
o espaco de possveis estrategias e tenta minimizar
uma func~ao utilidade;
os agentes decidem segundo suas crencas subjetivas
sobre outras crencas subjetivas, se aproximando as-
sim do comportamento dos agentes nanceiros se-
Page 2
2gundo a imagem do Concurso de Beleza de Keynes
[8] .;
os agentes se comportam de maneira auto-
referenciada, ou seja, olham para o proprio resul-
tado agregado das decis~oes de todos os agentes para
decidirem o que v~ao fazer no futuro;
do ponto de vista fsico, e um modelo dina^mico com
frustrac~ao, com um comportamente n~ao-trivial fora
do equilbrio e soluc~ao analtica.
II. APRESENTAC ~AO FORMAL DO MODELO:
O JOGO DA MINORIA
O problema de El Farol pode ser ligeiramente simpli-
cado e apresentado na forma de um sistema dina^mico
com regras simples denominado Jogo da Minoria (usare-
mos a sigla MG, do ingle^s Minority Game), proposto em
[2] e considerado o modelo mais simples para a descric~ao
de feno^menos sociais que possui feno^menos coletivos n~ao
triviais. O nome Jogo da Minoria deriva do fato de que,
assim como no problema de El Farol, e do interesse de
cada jogador estar na minoria. No MG, cada um dos N
agentes deve, a cada instante discreto de tempo t, realizar
um lance (bid):
bi(t) = 1
e, para ter \lucro", deve fazer a escolha contraria da feita
pela maioria dos agentes[9]. O valor agregado dos lances
sera At = A(t) = 1pN
P
i bi(t). Ha informac~ao publica
disponvel para os agentes sobre os lances agregados dos
ultimos m dias, na forma de um vetor binario:
(t) = (sgn(At 1); : : : ; sgn(At m)) 2 f 1; 1gm;
Cada agente possui ainda a seu dispo^r um conjunto de S
estrategias que s~ao func~oes da informac~ao publica:
Rig : f 1; 1gm ! f 1; 1g , g = 1; 2; : : : ; S:
Ou seja, dado o vetor (t), a estrategia preconiza uma
decis~ao:
Rig[(t)] = 1 ou 1;
de forma que, se no instante t o jogador i usar a estrategia
g, seu lance sera:
bi(t) = R
ig[(t)]:
Para efetivamente tomar a decis~ao, cada agente associa
a cada estrategia que possui uma certa pontuac~ao Uig(t)
baseada em seu desempenho. A cada dia essa pontuac~ao
e atualizada segundo qu~ao bem dada estrategia foi capaz
de prever a decis~ao da minoria:
pig(t+ 1) = pig(t) A(t)R
ig[(t)]
de forma que estrategias que aconselharam apostar +1
ser~ao punidas (U(t) < 0) se naquele dia a maioria apos-
tou +1 (A(t) > 0) e vice-versa. Finalmente a cada noite,
cada agente escolhe adotar a estrategia que acumulou a
maior pontuac~ao:
gi(t) = arg max
g
pig(t)
Em sntese o modelo e denido pelas seguintes etapas:
1. Selec~ao da estrategia:
gi(t) = arg max
g
pig(t) (1)
2. Agregac~ao das decis~oes:
A(t) =
NX
i=1
Ri;gi(t)[(t)] (2)
3. Atualizac~ao das pontuac~oes:
pig(t+ 1) = pig(t) A(t)R
ig[(t)] (3)
4. Atualizac~ao da informac~ao publica:
1(t+ 1) = sgn(A(t)) (4)
j(t+ 1) = j 1(t) para j > 1
As condic~oes iniciais para pig(t) e (t), bem como o con-
junto de estrategias de cada agente, ser~ao tratadas como
uma especie de desordem congelada e ser~ao sorteadas de
distribuic~oes adequadas. Trataremos sobre essa quest~ao
mais adiante, na soluc~ao do Jogo da Minoria.
Passaremos agora a discutir duas alterac~oes nesse mo-
delo que s~ao uteis do ponto de vista simulacional e
analtico e s~ao frequentes nesse tipo de modelo. Em pri-
meiro lugar vamos considerar a informac~ao publica. O
uso de informac~ao nos moldes acima torna esse modelo
n~ao-markoviano, o tem um efeito fatal sobre a sua so-
lubilidade. Dessa forma e util substituir o vetor (t)
por um vetor binario aleatorio de m componentes, sorte-
ado uniformemente. As simulac~oes computacionais desse
problema mostram que o comportamento do sistema n~ao
muda qualitativamente com essa mudanca. De fato, o
importante nesse modelo n~ao e a capacidade dos agentes
de prever a serie temporal de A(t), mas a capacidade de
prever a reac~ao dos outros agentes a essa serie. Portanto
espera-se que a natureza dessa serie n~ao afete seriamente
aspectos qualitativos do modelo.
III. FENOMENOLOGIA DO JOGO DA
MINORIA
Os primeiros estudos teoricos e simulac~oes mostraram
que o comportamento qualitativo do sistema e sensvel
apenas a um para^metro[6]:
=
2m
N
=
p
N
; (5)
[8] .;
os agentes se comportam de maneira auto-
referenciada, ou seja, olham para o proprio resul-
tado agregado das decis~oes de todos os agentes para
decidirem o que v~ao fazer no futuro;
do ponto de vista fsico, e um modelo dina^mico com
frustrac~ao, com um comportamente n~ao-trivial fora
do equilbrio e soluc~ao analtica.
II. APRESENTAC ~AO FORMAL DO MODELO:
O JOGO DA MINORIA
O problema de El Farol pode ser ligeiramente simpli-
cado e apresentado na forma de um sistema dina^mico
com regras simples denominado Jogo da Minoria (usare-
mos a sigla MG, do ingle^s Minority Game), proposto em
[2] e considerado o modelo mais simples para a descric~ao
de feno^menos sociais que possui feno^menos coletivos n~ao
triviais. O nome Jogo da Minoria deriva do fato de que,
assim como no problema de El Farol, e do interesse de
cada jogador estar na minoria. No MG, cada um dos N
agentes deve, a cada instante discreto de tempo t, realizar
um lance (bid):
bi(t) = 1
e, para ter \lucro", deve fazer a escolha contraria da feita
pela maioria dos agentes[9]. O valor agregado dos lances
sera At = A(t) = 1pN
P
i bi(t). Ha informac~ao publica
disponvel para os agentes sobre os lances agregados dos
ultimos m dias, na forma de um vetor binario:
(t) = (sgn(At 1); : : : ; sgn(At m)) 2 f 1; 1gm;
Cada agente possui ainda a seu dispo^r um conjunto de S
estrategias que s~ao func~oes da informac~ao publica:
Rig : f 1; 1gm ! f 1; 1g , g = 1; 2; : : : ; S:
Ou seja, dado o vetor (t), a estrategia preconiza uma
decis~ao:
Rig[(t)] = 1 ou 1;
de forma que, se no instante t o jogador i usar a estrategia
g, seu lance sera:
bi(t) = R
ig[(t)]:
Para efetivamente tomar a decis~ao, cada agente associa
a cada estrategia que possui uma certa pontuac~ao Uig(t)
baseada em seu desempenho. A cada dia essa pontuac~ao
e atualizada segundo qu~ao bem dada estrategia foi capaz
de prever a decis~ao da minoria:
pig(t+ 1) = pig(t) A(t)R
ig[(t)]
de forma que estrategias que aconselharam apostar +1
ser~ao punidas (U(t) < 0) se naquele dia a maioria apos-
tou +1 (A(t) > 0) e vice-versa. Finalmente a cada noite,
cada agente escolhe adotar a estrategia que acumulou a
maior pontuac~ao:
gi(t) = arg max
g
pig(t)
Em sntese o modelo e denido pelas seguintes etapas:
1. Selec~ao da estrategia:
gi(t) = arg max
g
pig(t) (1)
2. Agregac~ao das decis~oes:
A(t) =
NX
i=1
Ri;gi(t)[(t)] (2)
3. Atualizac~ao das pontuac~oes:
pig(t+ 1) = pig(t) A(t)R
ig[(t)] (3)
4. Atualizac~ao da informac~ao publica:
1(t+ 1) = sgn(A(t)) (4)
j(t+ 1) = j 1(t) para j > 1
As condic~oes iniciais para pig(t) e (t), bem como o con-
junto de estrategias de cada agente, ser~ao tratadas como
uma especie de desordem congelada e ser~ao sorteadas de
distribuic~oes adequadas. Trataremos sobre essa quest~ao
mais adiante, na soluc~ao do Jogo da Minoria.
Passaremos agora a discutir duas alterac~oes nesse mo-
delo que s~ao uteis do ponto de vista simulacional e
analtico e s~ao frequentes nesse tipo de modelo. Em pri-
meiro lugar vamos considerar a informac~ao publica. O
uso de informac~ao nos moldes acima torna esse modelo
n~ao-markoviano, o tem um efeito fatal sobre a sua so-
lubilidade. Dessa forma e util substituir o vetor (t)
por um vetor binario aleatorio de m componentes, sorte-
ado uniformemente. As simulac~oes computacionais desse
problema mostram que o comportamento do sistema n~ao
muda qualitativamente com essa mudanca. De fato, o
importante nesse modelo n~ao e a capacidade dos agentes
de prever a serie temporal de A(t), mas a capacidade de
prever a reac~ao dos outros agentes a essa serie. Portanto
espera-se que a natureza dessa serie n~ao afete seriamente
aspectos qualitativos do modelo.
III. FENOMENOLOGIA DO JOGO DA
MINORIA
Os primeiros estudos teoricos e simulac~oes mostraram
que o comportamento qualitativo do sistema e sensvel
apenas a um para^metro[6]:
=
2m
N
=
p
N
; (5)
Page 3
3Figura 1: Dina^mica de A(t) em func~ao do tempo para
uma realizac~ao do jogo da minoria para diversos valores do
para^metro M (variando portanto o parametro de controle .
Para baixos valores de observa-se uma dina^mica com estru-
tura complexa enquanto que para maior observa-se uma
diminuic~ao grande da volatilidade e uma simplicac~ao da
dina^mica. Abaixo, histogramas de A(t) e, para comparac~ao,
gaussianas com a mesma media e varia^ncia (linha tracejada).
ou seja, o numero de possveis padr~oes de memoria so-
bre o numero de agentes, e variado. Vamos conside-
rar a dina^mica do lance agregado (agregated bid, overall
bid)[10]:
A(t) =
1
p
N
NX
i=1
bi(t): (6)
A primeira observac~ao a respeito do lance agregado e
Figura 2: Volatilidade em func~ao de . A volatilidade muda
bruscamente de comportamento para = c. Alem disso ha
um regime em que o efeito coletivo do comportamento egoista
de cada agente e capaz de organizar o sistema em um mercado
mais eciente do que o aleatorio (linha tracejada).
que sua media e nula, e sua varia^ncia escala proporcio-
nalmente aN . Para abaixo de um certo limiar c, a dis-
tribuic~ao dos valores A(t) ao longo do tempo possui uma
estrutura complicada, com varios picos simetricamente
distribuidos, como se ve^ na gura 1 [11], e e fortemente
n~ao gaussiana. Para valores de > c, a distribuic~ao de
A(t) e muito proxima de uma gaussiana, com varia^ncia
bastante reduzida em comparac~ao ao caso anterior. Para
valores ainda maiores de ha um aumento monoto^nico
da varia^ncia de A(t), ainda com distribuic~ao aproxima-
damente gaussiana. Uma variavel interessante para ca-
racterizar essa mudanca de comportamento e a varia^ncia
do lance agregado, chamada na literatura econo^mica de
volatilidade:
2 = lim
L!1
LX
t=1
[A(t) hA(t)i]2 : (7)
Para termos um para^metro de comparac~ao, note que se
os lances fossem identicamente distribuidos e indepen-
dentes, ou seja, em um mercado aleatorio, teramos:
2 = hA(t)i =
1
N
X
ij
hbibji = 1:
Portanto, casos em que a volatilidade do MG e menor
do que 1 ser~ao denominados ecientes, no sentido de que
s~ao capazes de alocar os recursos de maneira mais e-
ciente do que um mercado aleatorio. Para compreender
essa armac~ao, note que essa situac~ao seria similar, no
caso do problema de El Farol, ao caso em que a ocupac~ao
media do restaurante oscila com pequena amplitude em
torno da ocupac~ao otima, ou seja, o recurso escasso esta
sendo explorado com pouco desperdcio (restaurante va-
zio ou lotado). Em casos em que > 1 teremos um mer-
cado ineciente (menos eciente que decis~oes aleatorias).
O resultado de simulac~oes para a volatilidade em func~ao
do para^metro de controle e mostrado na gura 2. Para
valores pequenos de o sistema se comporta de maneira
bastante ineciente, tendo uma volatilidade maior que
um mercado aleatorio. Mas para valores maiores de ha
uma diminuic~ao da volatilidade na direc~ao de um mer-
cado eciente. O mais notavel no entanto e fato de que
a curva n~ao e monoto^nica, mas muda bruscamente de
tende^ncia para um certo valor crtico de , o mesmo
valor para o qual a dina^mica de A(t) se torna menos
estruturada. Alem disso, nota-se que n~ao ha uma al-
terac~ao qualitativa no comportamento do sistema com a
mudanca no numero de estrategias S. Por simplicidade
portanto adotaremos daqui por diante o numero S = 2.
Uma outra caracterstica da transic~ao de fase do Jogo da
Minoria e o surgimento de agentes congelados, agentes
que nunca mudam sua estrategia. Medindo a freque^ncia
com que os agentes mudam de estrategia e possvel de-
terminar qual e a frac~ao de agentes que nunca mudam
de estrategia durante a simulac~ao do MG. Na gura 3
temos a frac~ao de agentes congelados em func~ao de .
Nota-se o brusco surgimento de agentes congelados para
> c, mais uma vez evidenciando uma transic~ao de
fase dina^mica. Finalmente, observa-se que a fase < c
n~ao e ergodica, possuindo uma forte depende^ncia com
uma realizac~ao do jogo da minoria para diversos valores do
para^metro M (variando portanto o parametro de controle .
Para baixos valores de observa-se uma dina^mica com estru-
tura complexa enquanto que para maior observa-se uma
diminuic~ao grande da volatilidade e uma simplicac~ao da
dina^mica. Abaixo, histogramas de A(t) e, para comparac~ao,
gaussianas com a mesma media e varia^ncia (linha tracejada).
ou seja, o numero de possveis padr~oes de memoria so-
bre o numero de agentes, e variado. Vamos conside-
rar a dina^mica do lance agregado (agregated bid, overall
bid)[10]:
A(t) =
1
p
N
NX
i=1
bi(t): (6)
A primeira observac~ao a respeito do lance agregado e
Figura 2: Volatilidade em func~ao de . A volatilidade muda
bruscamente de comportamento para = c. Alem disso ha
um regime em que o efeito coletivo do comportamento egoista
de cada agente e capaz de organizar o sistema em um mercado
mais eciente do que o aleatorio (linha tracejada).
que sua media e nula, e sua varia^ncia escala proporcio-
nalmente aN . Para abaixo de um certo limiar c, a dis-
tribuic~ao dos valores A(t) ao longo do tempo possui uma
estrutura complicada, com varios picos simetricamente
distribuidos, como se ve^ na gura 1 [11], e e fortemente
n~ao gaussiana. Para valores de > c, a distribuic~ao de
A(t) e muito proxima de uma gaussiana, com varia^ncia
bastante reduzida em comparac~ao ao caso anterior. Para
valores ainda maiores de ha um aumento monoto^nico
da varia^ncia de A(t), ainda com distribuic~ao aproxima-
damente gaussiana. Uma variavel interessante para ca-
racterizar essa mudanca de comportamento e a varia^ncia
do lance agregado, chamada na literatura econo^mica de
volatilidade:
2 = lim
L!1
LX
t=1
[A(t) hA(t)i]2 : (7)
Para termos um para^metro de comparac~ao, note que se
os lances fossem identicamente distribuidos e indepen-
dentes, ou seja, em um mercado aleatorio, teramos:
2 = hA(t)i =
1
N
X
ij
hbibji = 1:
Portanto, casos em que a volatilidade do MG e menor
do que 1 ser~ao denominados ecientes, no sentido de que
s~ao capazes de alocar os recursos de maneira mais e-
ciente do que um mercado aleatorio. Para compreender
essa armac~ao, note que essa situac~ao seria similar, no
caso do problema de El Farol, ao caso em que a ocupac~ao
media do restaurante oscila com pequena amplitude em
torno da ocupac~ao otima, ou seja, o recurso escasso esta
sendo explorado com pouco desperdcio (restaurante va-
zio ou lotado). Em casos em que > 1 teremos um mer-
cado ineciente (menos eciente que decis~oes aleatorias).
O resultado de simulac~oes para a volatilidade em func~ao
do para^metro de controle e mostrado na gura 2. Para
valores pequenos de o sistema se comporta de maneira
bastante ineciente, tendo uma volatilidade maior que
um mercado aleatorio. Mas para valores maiores de ha
uma diminuic~ao da volatilidade na direc~ao de um mer-
cado eciente. O mais notavel no entanto e fato de que
a curva n~ao e monoto^nica, mas muda bruscamente de
tende^ncia para um certo valor crtico de , o mesmo
valor para o qual a dina^mica de A(t) se torna menos
estruturada. Alem disso, nota-se que n~ao ha uma al-
terac~ao qualitativa no comportamento do sistema com a
mudanca no numero de estrategias S. Por simplicidade
portanto adotaremos daqui por diante o numero S = 2.
Uma outra caracterstica da transic~ao de fase do Jogo da
Minoria e o surgimento de agentes congelados, agentes
que nunca mudam sua estrategia. Medindo a freque^ncia
com que os agentes mudam de estrategia e possvel de-
terminar qual e a frac~ao de agentes que nunca mudam
de estrategia durante a simulac~ao do MG. Na gura 3
temos a frac~ao de agentes congelados em func~ao de .
Nota-se o brusco surgimento de agentes congelados para
> c, mais uma vez evidenciando uma transic~ao de
fase dina^mica. Finalmente, observa-se que a fase < c
n~ao e ergodica, possuindo uma forte depende^ncia com
Page 4
4Figura 3: Frac~ao de agentes congelados em func~ao de . Mais
uma vez evide^nciando uma mudanca radical na dina^mica do
sistema proximo ao ponto c.
as pontuac~oes iniciais que cada agente da as estrategias
antes do incio do jogo. Os gracos mostrados ate agora
foram feitos inicializando as pontuac~oes com o mesmo va-
lor pig(0) = 0. Entretanto, escolhendo condic~oes iniciais
diferentes para as pontuac~oes (para o caso S=2):
jpi1 pi2j = 2 > 0
obtemos a gura apresentada em 4. No graco da vola-
tilidade versus podemos ver uma grande diferenca nos
comportamentos para pequenos e grandes valores de
apenas na fase < c, que chamaremos a partir de agora
de fase n~ao-ergodica. Ha dois ramos para a curva: um
ramo para pequenos valores de , com alta volatilidade,
e um ramo com grandes valores de e baixa volatili-
dade. Ha diferencas grandes tambem na dina^mica de
A(t): no ramo de baixa volatilidade os histogramas de
A(t) muito proximos de uma gaussiana mesmo na fase
n~ao-ergodica. As curvas contra podem ser quase
perfeitamente ajustadas por:
1=2;para o ramo de alta volatilidade,
1=2;para o ramo de baixa volatilidade.
Tambem a frac~ao de agentes congelados apresenta com-
portamentos distintos para os diferentes ramos. Para o
ramo de volatilidade alta n~ao ha agentes congelados para
< c, enquanto que para o ramo de baixa volatilidade
ha uma grande frac~ao desses agentes, chegando inclusive
a ser proxima de 1 para pequeno. Alem disso os gracos
da gura 4 apresentam os resultados para os dois tipos
de informac~ao publica: a memoria real, em que o vetor
e dado pela equac~ao (4), e o caso de fake history, quando
a memoria e apenas um vetor binario aletorio. Observa-
se que o comportamento e qualitativamente ide^ntico e
mesmo quantitativamente muito proximo.
IV. ESPECIALIZAC ~AO PARA O CASO S=2 E
LIMITE DE TEMPO CONTINUO
Para proceder com a soluc~ao do jogo da minoria algu-
mas manipulac~oes e mudancas de notac~ao ser~ao feitas.
Em primeiro lugar, como vimos, o numero de estrategias
nao in
uencia qualitativamente a soluc~ao. Tomaremos
assim, como medida de simplicac~ao, S = 2. Em seguida
vamos adotar o regime de fake history, escolhendo o vetor
de memoria aleatoriamente no conjunto f 1; 1gm. Po-
demos mapear os vetores de memorias no conjunto dos
numeros naturais f1; 2; 3; : : : ; 2mg atraves da seguinte re-
presentac~ao:
= 1 +
mX
i=1
i + 1
2
2i 1: (8)
Assim, as estrategias ser~ao func~ao de um numero inteiro
entre 1 e p = 2m sorteado uniformemente nesse conjunto:
Ri;g[] = Ri;g ; = 1,2,: : :,p:
Uma vez que S=2, e conveniente denir novas variaveis:
!i =
1
2
Ri;1 +R
i;2
(9)
i =
1
2
Ri;1 R
i;2
(10)
qi(t) =
1
2
(pi1(t) pi2(t)) (11)
A estrategia 1 sera escolhida (gi(t) = 1) se qi(t) > 0
e a estrategia 2 sera escolhida (gi(t) = 2)se qi(t) < 0).
Portanto g(t) e uma func~ao de sgn(qi(t)). Portanto a
estrategia escolhida tambem sera func~ao de sgn(qi(t)):
Ri;gi(t) = R
i
(sgn(qi(t)))
Toda func~ao de uma variavel que toma valores em f1; 1g
pode ser escrita como:
Ri;gi =
1
2
Ri;1 +R
i;2
+ sgn(qi[gi])
1
2
Ri;1 R
i;2
= !i + sgn(qi[gi])
i
e portanto a equac~ao de escolha de estrategia (1) pode
ser substituda por:
A(t) =
1
p
N
NX
i=1
!i(t) + sgn(qi(t))
i
(t)
(12)
uma vez evide^nciando uma mudanca radical na dina^mica do
sistema proximo ao ponto c.
as pontuac~oes iniciais que cada agente da as estrategias
antes do incio do jogo. Os gracos mostrados ate agora
foram feitos inicializando as pontuac~oes com o mesmo va-
lor pig(0) = 0. Entretanto, escolhendo condic~oes iniciais
diferentes para as pontuac~oes (para o caso S=2):
jpi1 pi2j = 2 > 0
obtemos a gura apresentada em 4. No graco da vola-
tilidade versus podemos ver uma grande diferenca nos
comportamentos para pequenos e grandes valores de
apenas na fase < c, que chamaremos a partir de agora
de fase n~ao-ergodica. Ha dois ramos para a curva: um
ramo para pequenos valores de , com alta volatilidade,
e um ramo com grandes valores de e baixa volatili-
dade. Ha diferencas grandes tambem na dina^mica de
A(t): no ramo de baixa volatilidade os histogramas de
A(t) muito proximos de uma gaussiana mesmo na fase
n~ao-ergodica. As curvas contra podem ser quase
perfeitamente ajustadas por:
1=2;para o ramo de alta volatilidade,
1=2;para o ramo de baixa volatilidade.
Tambem a frac~ao de agentes congelados apresenta com-
portamentos distintos para os diferentes ramos. Para o
ramo de volatilidade alta n~ao ha agentes congelados para
< c, enquanto que para o ramo de baixa volatilidade
ha uma grande frac~ao desses agentes, chegando inclusive
a ser proxima de 1 para pequeno. Alem disso os gracos
da gura 4 apresentam os resultados para os dois tipos
de informac~ao publica: a memoria real, em que o vetor
e dado pela equac~ao (4), e o caso de fake history, quando
a memoria e apenas um vetor binario aletorio. Observa-
se que o comportamento e qualitativamente ide^ntico e
mesmo quantitativamente muito proximo.
IV. ESPECIALIZAC ~AO PARA O CASO S=2 E
LIMITE DE TEMPO CONTINUO
Para proceder com a soluc~ao do jogo da minoria algu-
mas manipulac~oes e mudancas de notac~ao ser~ao feitas.
Em primeiro lugar, como vimos, o numero de estrategias
nao in
uencia qualitativamente a soluc~ao. Tomaremos
assim, como medida de simplicac~ao, S = 2. Em seguida
vamos adotar o regime de fake history, escolhendo o vetor
de memoria aleatoriamente no conjunto f 1; 1gm. Po-
demos mapear os vetores de memorias no conjunto dos
numeros naturais f1; 2; 3; : : : ; 2mg atraves da seguinte re-
presentac~ao:
= 1 +
mX
i=1
i + 1
2
2i 1: (8)
Assim, as estrategias ser~ao func~ao de um numero inteiro
entre 1 e p = 2m sorteado uniformemente nesse conjunto:
Ri;g[] = Ri;g ; = 1,2,: : :,p:
Uma vez que S=2, e conveniente denir novas variaveis:
!i =
1
2
Ri;1 +R
i;2
(9)
i =
1
2
Ri;1 R
i;2
(10)
qi(t) =
1
2
(pi1(t) pi2(t)) (11)
A estrategia 1 sera escolhida (gi(t) = 1) se qi(t) > 0
e a estrategia 2 sera escolhida (gi(t) = 2)se qi(t) < 0).
Portanto g(t) e uma func~ao de sgn(qi(t)). Portanto a
estrategia escolhida tambem sera func~ao de sgn(qi(t)):
Ri;gi(t) = R
i
(sgn(qi(t)))
Toda func~ao de uma variavel que toma valores em f1; 1g
pode ser escrita como:
Ri;gi =
1
2
Ri;1 +R
i;2
+ sgn(qi[gi])
1
2
Ri;1 R
i;2
= !i + sgn(qi[gi])
i
e portanto a equac~ao de escolha de estrategia (1) pode
ser substituda por:
A(t) =
1
p
N
NX
i=1
!i(t) + sgn(qi(t))
i
(t)
(12)
Page 5
5Figura 4: Volatidade e frac~ao de agentes congelados em func~ao de para diferentes condic~oes iniciais, evidenciando o carater
n~ao-ergodico da fase < c. Note tambem a comparac~ao entre as simulac~oes com memoria real (crculos cheios) e com \fake
history" (crculos vazios)
A. Decision Noise
Uma pequena generalizac~ao permite simplicar
calculos a seguir e tambem obter agentes mais realistas.
Vamos trocar, na equac~ao (12) a func~ao sgn(qi(t)) por
uma denic~ao mais geral:
[q; z] = sgn[q + Tz] (13)
onde z e uma variavel aletoria de distribuic~ao simetrica
em torno de zero. Ficamos ent~ao com:
A(t) =
1
p
N
NX
i=1
!i(t) + [qi(t); zi(t)]
i
(t)
Essa mudanca acrescenta um pouco mais de limitac~ao na
racionalidade dos agentes: eles n~ao s~ao mais nem capa-
zes de escolher suas estrategias por um processo objetivo
de maximizac~ao, mas algum \rudo de subjetividade" e
introduzido. A forma usada na equac~ao (13) e conhecida
como additive decision noise. Outras formas de decision
noise s~ao possveis e usadas na literatura, porem vamos
nos restringir ao rudo aditivo, tomando z de uma distri-
buic~ao gaussiana de media zero e varia^ncia unitaria. Nos
sera util no futuro conhecer o valor esperado de (13) com
relac~ao a distribuic~ao de z:
[q] =
Z
dzP (z)[q; z] = erf
q
T
p
2
: (14)
Da denic~ao (11) e da equac~ao (3) podemos obter a
evoluc~ao para qi(t):
qi(t+ 1) = qi(t)
p
N
i(t)A(t)
onde introduzimos uma taxa de aprendizado multipli-
cando o segundo termo, com uma escala futuramente con-
veniente em N. Finalmente a dina^mica do jogo da minoria
com S=2 e decision noise sera dada por:
qi(t+ 1) = qi(t)
p
N
i(t)A(t)[q(t); z(t)] (15)
A[q; z] =
+
1
p
N
X
i
[qi; zi]i
com vetores em negrito no representando variaveis de-
pendentes de = 1; 2; : : : ; p (vetores em Rp):
A = (A1; A2; : : : ; Ap)
i =
i1;
i
2; : : : ;
i
p
etc. . .
e com
= N
1
2
P
i !
i
.
B. Tempo contnuo e equac~ao mestra
Note que as equac~oes (15) denem uma cadeia de Mar-
kov para o vetor de estado q do sistema. S~ao duas fontes
de aleatoriedade nessa cadeia de Markov: o rudo de de-
cis~ao z(t) e o inteiro que denota os padr~oes de informac~ao
publica (falsa) no instante t (t). Vamos denotar por
pt(q) a densidade de probabilidade de que no instante t,
o vetor de estado seja q. A dina^mica dada por (15) e
equivalente a seguinte equac~ao para a dina^mica de pt(q):
pt+1(q) =
Z
dq0W (qjq0)pt(q0) (16)
onde a probabilidade de transic~ao W (qjq0) e dada por:
W (qjq0) =
*
Y
i
qi q
0
i +
p
N
iA[q
0; z]
+
z;
:
(17)
n~ao-ergodico da fase < c. Note tambem a comparac~ao entre as simulac~oes com memoria real (crculos cheios) e com \fake
history" (crculos vazios)
A. Decision Noise
Uma pequena generalizac~ao permite simplicar
calculos a seguir e tambem obter agentes mais realistas.
Vamos trocar, na equac~ao (12) a func~ao sgn(qi(t)) por
uma denic~ao mais geral:
[q; z] = sgn[q + Tz] (13)
onde z e uma variavel aletoria de distribuic~ao simetrica
em torno de zero. Ficamos ent~ao com:
A(t) =
1
p
N
NX
i=1
!i(t) + [qi(t); zi(t)]
i
(t)
Essa mudanca acrescenta um pouco mais de limitac~ao na
racionalidade dos agentes: eles n~ao s~ao mais nem capa-
zes de escolher suas estrategias por um processo objetivo
de maximizac~ao, mas algum \rudo de subjetividade" e
introduzido. A forma usada na equac~ao (13) e conhecida
como additive decision noise. Outras formas de decision
noise s~ao possveis e usadas na literatura, porem vamos
nos restringir ao rudo aditivo, tomando z de uma distri-
buic~ao gaussiana de media zero e varia^ncia unitaria. Nos
sera util no futuro conhecer o valor esperado de (13) com
relac~ao a distribuic~ao de z:
[q] =
Z
dzP (z)[q; z] = erf
q
T
p
2
: (14)
Da denic~ao (11) e da equac~ao (3) podemos obter a
evoluc~ao para qi(t):
qi(t+ 1) = qi(t)
p
N
i(t)A(t)
onde introduzimos uma taxa de aprendizado multipli-
cando o segundo termo, com uma escala futuramente con-
veniente em N. Finalmente a dina^mica do jogo da minoria
com S=2 e decision noise sera dada por:
qi(t+ 1) = qi(t)
p
N
i(t)A(t)[q(t); z(t)] (15)
A[q; z] =
+
1
p
N
X
i
[qi; zi]i
com vetores em negrito no representando variaveis de-
pendentes de = 1; 2; : : : ; p (vetores em Rp):
A = (A1; A2; : : : ; Ap)
i =
i1;
i
2; : : : ;
i
p
etc. . .
e com
= N
1
2
P
i !
i
.
B. Tempo contnuo e equac~ao mestra
Note que as equac~oes (15) denem uma cadeia de Mar-
kov para o vetor de estado q do sistema. S~ao duas fontes
de aleatoriedade nessa cadeia de Markov: o rudo de de-
cis~ao z(t) e o inteiro que denota os padr~oes de informac~ao
publica (falsa) no instante t (t). Vamos denotar por
pt(q) a densidade de probabilidade de que no instante t,
o vetor de estado seja q. A dina^mica dada por (15) e
equivalente a seguinte equac~ao para a dina^mica de pt(q):
pt+1(q) =
Z
dq0W (qjq0)pt(q0) (16)
onde a probabilidade de transic~ao W (qjq0) e dada por:
W (qjq0) =
*
Y
i
qi q
0
i +
p
N
iA[q
0; z]
+
z;
:
(17)
Page 6
6A media em z e em e dada por:
hiz; =
1
p
pX
=1
Z
dzP (z)
As processo estocastico acima pode ser transformado
num processo a tempo contnuo da seguinte forma:
atribui-se a cada passo uma durac~ao aleatoria, sorteada
de um processo de Poisson de media N e posterior-
mente faz-se N ! 0. Esse procedimento, tpico no
estudo de processos a tempo discreto, e denominado re-
gularizac~ao temporal. Dessa forma, a probabilidade do
sistema encontrar-se no estado q no tempo (contnuo) t
e dada por:
pt(q) =
X
`>0
`(t)p`(q)
onde `(t) e a probabilidade ` passos tenham sido da-
dos no instante t e e dada pela distribuic~ao de Poisson
e t=N
`!
t
N
`
. Tomando a derivada temporal de pt(q)
obtem-se a equac~ao mestra a tempo contnuo:
@pt(q)
@t
=
1
N
Z
dq0 [W (qjq0) (q q0)] pt(q0) (18)
Note que para fazer o limite ! 0 precisamos determi-
nar a escala adequada de N com o numero de agentes
N para que n~ao haja diverge^ncias.
C. Expans~ao de Kramers-Moyal, equac~ao de
Fokker-Planck
Nesse ponto iniciamos um conjunto de aproximac~oes,
algumas justicaveis apenas pelo sucesso do resultado -
nal, para alcancar uma soluc~ao (quase) satisfatoria do
modelo. A primeira dessas aproximac~oes e a realizac~ao
de uma expans~ao de Kramers-Moyal da equac~ao mestra,
truncada em segunda ordem para obter uma equac~ao de
Fokker-Planck. O primeiro passo e expandir a probabi-
lidade de transic~ao (17) em pote^ncias de (adotando a
convenc~ao de soma nos ndices latinos):
W (qjq0) =
1 +
p
N
A[q0; z]i
@
@qi
+
2
2N
A[q0; z]2i
j
@2
@qi@qj
+ : : :
(q q0)
z;
= (q q0) +
p
p
N
Fi(q0)
@
@qi
(q q0) +
2
2pN
Mij(q0)
@2
@qi@qj
(q q0) +O
3
Onde denimos as func~oes:
Fi = p
A[q; z]i
z;
Mij = p
A[q; z]2i
j
z;
Portanto, o membro direito da equac~ao mestra (18) pode
ser reescrita como:
@pt(q)
@t
=
1
N
Z
dq0 [W (qjq0) (q q0)] pt(q0)
=
pN
Z
dq0
1
p
N
Fi(q0)
@
@qi
(q q0) +
2N
Mij(q0)
@2
@qi@qj
(q q0)
pt(q0)
Realizando as integrais nalmente chegamos a:
@pt(q)
@t
=
pN
@
@qi
1
p
N
Fi(q)pt(q)
+
+
1
2
@2
@qi@qj
N
Mij(q)pt(q)
Para determinar como N deve escalar com o numero
de agentes vamos notar, lembrando que uma soma de N
variaveis i.i.d. escala com
p
N e que uma soma de qua-
drados de N variaveis i.i.d. escala com N, que os termos
da expans~ao escalam da seguinte forma:
Fi =
X
A[q; z]i
z
p
N
Mij =
X
A[q; z]2i
j
z
N:
O termo de ordem 3 escala com
p
N , similarmente a Fi.
Assim, se escolhermos N 1=N , os termos de ordem
1 e 2 s~ao nitos no limite termodina^mico e os termos
de ordem superior se anulam. Portanto vamos escolher,
am de selecionar a escala de tempo na equac~ao acima e
eliminar algumas variaveis (lembre-se que p = N):
N =
2N
Uma segunda vantagem dessa escolha e que o limite ter-
modina^mico torna-se automaticamente o limite de tempo
contnuo N ! 0. Assim camos com:
@pt
@t
=
@
@qi
F ipt
+
1
2
@2
@qi@qj
M ijpt
+O
N 1
(19)
A equac~ao (19) e uma equac~ao de Fokker-Planck com
termos de deriva e de difus~ao dados por:
F i(q) =
2
p
N
Fi(q) N0 (20)
1
2
M ij(q) =
N
Mij(q) N0: (21)
V. SOLUC ~AO APROXIMADA
A. Pseudo-equilbrio
A equac~ao de Fokker-Planck (19) pode se associar uma
equac~ao de Langevin para as variaveis q(t) dada por[5]:
dq = Fdt+ G(q)dW (22)
hiz; =
1
p
pX
=1
Z
dzP (z)
As processo estocastico acima pode ser transformado
num processo a tempo contnuo da seguinte forma:
atribui-se a cada passo uma durac~ao aleatoria, sorteada
de um processo de Poisson de media N e posterior-
mente faz-se N ! 0. Esse procedimento, tpico no
estudo de processos a tempo discreto, e denominado re-
gularizac~ao temporal. Dessa forma, a probabilidade do
sistema encontrar-se no estado q no tempo (contnuo) t
e dada por:
pt(q) =
X
`>0
`(t)p`(q)
onde `(t) e a probabilidade ` passos tenham sido da-
dos no instante t e e dada pela distribuic~ao de Poisson
e t=N
`!
t
N
`
. Tomando a derivada temporal de pt(q)
obtem-se a equac~ao mestra a tempo contnuo:
@pt(q)
@t
=
1
N
Z
dq0 [W (qjq0) (q q0)] pt(q0) (18)
Note que para fazer o limite ! 0 precisamos determi-
nar a escala adequada de N com o numero de agentes
N para que n~ao haja diverge^ncias.
C. Expans~ao de Kramers-Moyal, equac~ao de
Fokker-Planck
Nesse ponto iniciamos um conjunto de aproximac~oes,
algumas justicaveis apenas pelo sucesso do resultado -
nal, para alcancar uma soluc~ao (quase) satisfatoria do
modelo. A primeira dessas aproximac~oes e a realizac~ao
de uma expans~ao de Kramers-Moyal da equac~ao mestra,
truncada em segunda ordem para obter uma equac~ao de
Fokker-Planck. O primeiro passo e expandir a probabi-
lidade de transic~ao (17) em pote^ncias de (adotando a
convenc~ao de soma nos ndices latinos):
W (qjq0) =
1 +
p
N
A[q0; z]i
@
@qi
+
2
2N
A[q0; z]2i
j
@2
@qi@qj
+ : : :
(q q0)
z;
= (q q0) +
p
p
N
Fi(q0)
@
@qi
(q q0) +
2
2pN
Mij(q0)
@2
@qi@qj
(q q0) +O
3
Onde denimos as func~oes:
Fi = p
A[q; z]i
z;
Mij = p
A[q; z]2i
j
z;
Portanto, o membro direito da equac~ao mestra (18) pode
ser reescrita como:
@pt(q)
@t
=
1
N
Z
dq0 [W (qjq0) (q q0)] pt(q0)
=
pN
Z
dq0
1
p
N
Fi(q0)
@
@qi
(q q0) +
2N
Mij(q0)
@2
@qi@qj
(q q0)
pt(q0)
Realizando as integrais nalmente chegamos a:
@pt(q)
@t
=
pN
@
@qi
1
p
N
Fi(q)pt(q)
+
+
1
2
@2
@qi@qj
N
Mij(q)pt(q)
Para determinar como N deve escalar com o numero
de agentes vamos notar, lembrando que uma soma de N
variaveis i.i.d. escala com
p
N e que uma soma de qua-
drados de N variaveis i.i.d. escala com N, que os termos
da expans~ao escalam da seguinte forma:
Fi =
X
A[q; z]i
z
p
N
Mij =
X
A[q; z]2i
j
z
N:
O termo de ordem 3 escala com
p
N , similarmente a Fi.
Assim, se escolhermos N 1=N , os termos de ordem
1 e 2 s~ao nitos no limite termodina^mico e os termos
de ordem superior se anulam. Portanto vamos escolher,
am de selecionar a escala de tempo na equac~ao acima e
eliminar algumas variaveis (lembre-se que p = N):
N =
2N
Uma segunda vantagem dessa escolha e que o limite ter-
modina^mico torna-se automaticamente o limite de tempo
contnuo N ! 0. Assim camos com:
@pt
@t
=
@
@qi
F ipt
+
1
2
@2
@qi@qj
M ijpt
+O
N 1
(19)
A equac~ao (19) e uma equac~ao de Fokker-Planck com
termos de deriva e de difus~ao dados por:
F i(q) =
2
p
N
Fi(q) N0 (20)
1
2
M ij(q) =
N
Mij(q) N0: (21)
V. SOLUC ~AO APROXIMADA
A. Pseudo-equilbrio
A equac~ao de Fokker-Planck (19) pode se associar uma
equac~ao de Langevin para as variaveis q(t) dada por[5]:
dq = Fdt+ G(q)dW (22)
Page 7
7com os coecientes G relacionados com os coecientes de
deriva e difus~ao F i e M i;j e dW processos de Wiener
i.i.d. . Escrevendo explicitamente o vetor F , temos:
Fi =
2
p
N
p
A[q; z]i
z;
=
2
p
N
pX
=1
Z
dzP (z)A[q; z]i
=
2
p
N
pX
=1
Z
dzP (z)
+
1
p
N
X
i
[qi; zi]i
!
i
=
2
p
N
0
@i
+
1
p
N
X
j
i j[qj ]
1
A :
Se nos permitirmos fazer uma aproximac~ao exploratoria,
totalmente injusticada, mas que se mostrara frutfera,
vamos ignorar o termo estocastico da equac~ao de Lange-
vin e nos concentrar na dina^mica determinstica:
dqi
dt
=
2
p
N
0
@i
+
1
p
N
X
j
i j[qj ]
1
A =
@L(q)
@[qi]
em que:
L(q) =
X
8
<
:
+
1
p
N
X
j
j[qj ]
9
=
;
2
:
Essa aproximac~ao, equivalente a tomar ! 0 na equac~ao
de Fokker-Planck, e denominada na literatura do Jogo da
Minoria de aproximac~ao de pseudo-equilbrio. De fato
o MG n~ao apresenta estados de equilbrio e n~ao satis-
faz condic~oes de balanco detalhado. E estritamente um
problema de n~ao-equilibrio. O limite ! 0 permite en-
tretanto introduzir com a m~ao estados de equilbrio que,
espera-se, digam algo sobre o sistema. Espera-se que,
caso a soluc~ao n~ao seja muito patologica, pelo menos as-
pectos qualitativos relacionados a media de q possam ser
tangidos com essa aproximac~ao. O primeiro fato a se no-
tar sobre essa dina^mica e que se trata de uma dina^mica de
minimizac~ao da func~ao L(q) que, de fato, e uma func~ao
de Lyapunov dessa dina^mica. Portanto, nos limites dessa
aproximac~ao, no limite t ! 1 o sistema se acomodara
em um dos mnimos de L(q)
B. Meca^nica Estatstica
Como observado na sec~ao anterior, os mnimos da
func~ao L(q) devem determinar o comportamento do sis-
tema, na aproximac~ao de pseudo-equilbrio. Uma vez que
a func~ao de Lyapunov depende de q apenas atraves das
variaveis [qj ], basta-nos minimizar (adicionando uma
constante multiplicativa inofensiva):
H() =
1
X
8
<
:
+
1
p
N
X
j
jj
9
=
;
2
: (23)
A minimizac~ao dessa func~ao via tecnicas usuais pode ser
um problema formidavel, especialmente por causa dos
vnculos satisfeitos pelas variaveis:
j 2 [ 1; 1]:
Um possvel atalho para a soluc~ao desse problema e ado-
tar o ponto de vista da tecnica computacional denomi-
nada Simulated Annealing, ou seja, encarar um problema
de minimizac~ao como a busca pelo estado fundamental
de uma hamiltoniana. Portanto vamos encarar a func~ao
(23) como uma func~ao hamiltoniana nas variaveis j e
buscar o limite T ! 0 de sua func~ao de partic~ao:
ZN =
Z
[ 1;1]N
de
P
n
+ 1pN
P
j
j
j
o2
:
(24)
e da sua energia livre:
f = lim
N!1
1
N
logZN :
Espera-se que no limite termodina^mico a energia livre
n~ao dependa de detalhes microscopicos dos vetores de
estrategia que constituem a desordem congelada nesse
sistema (
e i) mas apenas das suas propriedades es-
tatsticas gerais, ou seja, espera-se que a energia livre
seja uma grandeza auto-mediante. Assim, consideramos
as medias sobre as distribuic~oes de desordem:
hfid = limN!1
1
N
hlogZN id (25)
com:
hid =
Z
d
diP (
; i)
C. Media sobre a desordem: replicas
Infelizmente medias como as da equac~ao (25) s~ao muito
difceis. Para evitar ter de calcular medias de logartmos
vamos adotar o truque de replicas para troca-las por
medias de pote^ncias de ZN :
hfid = limN!1
lim
n!0
1
nN
log hZnN id (26)
como de praxe na teoria de replicas, vamos trocar a
pote^ncia ZnN pela func~ao de partic~ao de n copias n~ao-
interagentes de H():
hZnN id = Tr
e
P
P
n
+ 1pN
P
j
j
j
o2
:
d
:
O ndice de replicas varia de 1 a n e o traco e dado por:
Tr =
Z
[ 1;1]nN
Y
i;
di
deriva e difus~ao F i e M i;j e dW processos de Wiener
i.i.d. . Escrevendo explicitamente o vetor F , temos:
Fi =
2
p
N
p
A[q; z]i
z;
=
2
p
N
pX
=1
Z
dzP (z)A[q; z]i
=
2
p
N
pX
=1
Z
dzP (z)
+
1
p
N
X
i
[qi; zi]i
!
i
=
2
p
N
0
@i
+
1
p
N
X
j
i j[qj ]
1
A :
Se nos permitirmos fazer uma aproximac~ao exploratoria,
totalmente injusticada, mas que se mostrara frutfera,
vamos ignorar o termo estocastico da equac~ao de Lange-
vin e nos concentrar na dina^mica determinstica:
dqi
dt
=
2
p
N
0
@i
+
1
p
N
X
j
i j[qj ]
1
A =
@L(q)
@[qi]
em que:
L(q) =
X
8
<
:
+
1
p
N
X
j
j[qj ]
9
=
;
2
:
Essa aproximac~ao, equivalente a tomar ! 0 na equac~ao
de Fokker-Planck, e denominada na literatura do Jogo da
Minoria de aproximac~ao de pseudo-equilbrio. De fato
o MG n~ao apresenta estados de equilbrio e n~ao satis-
faz condic~oes de balanco detalhado. E estritamente um
problema de n~ao-equilibrio. O limite ! 0 permite en-
tretanto introduzir com a m~ao estados de equilbrio que,
espera-se, digam algo sobre o sistema. Espera-se que,
caso a soluc~ao n~ao seja muito patologica, pelo menos as-
pectos qualitativos relacionados a media de q possam ser
tangidos com essa aproximac~ao. O primeiro fato a se no-
tar sobre essa dina^mica e que se trata de uma dina^mica de
minimizac~ao da func~ao L(q) que, de fato, e uma func~ao
de Lyapunov dessa dina^mica. Portanto, nos limites dessa
aproximac~ao, no limite t ! 1 o sistema se acomodara
em um dos mnimos de L(q)
B. Meca^nica Estatstica
Como observado na sec~ao anterior, os mnimos da
func~ao L(q) devem determinar o comportamento do sis-
tema, na aproximac~ao de pseudo-equilbrio. Uma vez que
a func~ao de Lyapunov depende de q apenas atraves das
variaveis [qj ], basta-nos minimizar (adicionando uma
constante multiplicativa inofensiva):
H() =
1
X
8
<
:
+
1
p
N
X
j
jj
9
=
;
2
: (23)
A minimizac~ao dessa func~ao via tecnicas usuais pode ser
um problema formidavel, especialmente por causa dos
vnculos satisfeitos pelas variaveis:
j 2 [ 1; 1]:
Um possvel atalho para a soluc~ao desse problema e ado-
tar o ponto de vista da tecnica computacional denomi-
nada Simulated Annealing, ou seja, encarar um problema
de minimizac~ao como a busca pelo estado fundamental
de uma hamiltoniana. Portanto vamos encarar a func~ao
(23) como uma func~ao hamiltoniana nas variaveis j e
buscar o limite T ! 0 de sua func~ao de partic~ao:
ZN =
Z
[ 1;1]N
de
P
n
+ 1pN
P
j
j
j
o2
:
(24)
e da sua energia livre:
f = lim
N!1
1
N
logZN :
Espera-se que no limite termodina^mico a energia livre
n~ao dependa de detalhes microscopicos dos vetores de
estrategia que constituem a desordem congelada nesse
sistema (
e i) mas apenas das suas propriedades es-
tatsticas gerais, ou seja, espera-se que a energia livre
seja uma grandeza auto-mediante. Assim, consideramos
as medias sobre as distribuic~oes de desordem:
hfid = limN!1
1
N
hlogZN id (25)
com:
hid =
Z
d
diP (
; i)
C. Media sobre a desordem: replicas
Infelizmente medias como as da equac~ao (25) s~ao muito
difceis. Para evitar ter de calcular medias de logartmos
vamos adotar o truque de replicas para troca-las por
medias de pote^ncias de ZN :
hfid = limN!1
lim
n!0
1
nN
log hZnN id (26)
como de praxe na teoria de replicas, vamos trocar a
pote^ncia ZnN pela func~ao de partic~ao de n copias n~ao-
interagentes de H():
hZnN id = Tr
e
P
P
n
+ 1pN
P
j
j
j
o2
:
d
:
O ndice de replicas varia de 1 a n e o traco e dado por:
Tr =
Z
[ 1;1]nN
Y
i;
di
Page 8
8Para o calculo da media acima procederemos com uma
serie de truques comuns nesse tipo de calculo. Em pri-
meiro lugar, introduziremos variaveis gaussianas para
linearizar o expoente (lembrando a denic~ao de
na
pagina 5):
hZnN id = Tr
Z
DX
D
ei
p
2
N
P
P
X
P
jf!i+jj g
E
d
:
Onde estamos usando a abreviac~ao[12]:
DX =
Y
;
dX
2np=2
exp( X2=2):
A media sobre a desordem pode agora ser calculada de
maneira trivial:
D
ei
p
2
N
P
P
X
P
jf!i+jj g
E
d
=
D
ei
p
2N
P
P
X
P
jf[Ri1 +Ri2 ]+[Ri1 Ri2 ]j g
E
d
Uma vez que Rig s~ao independetemente sorteadas do con-
junto f 1; 1g, temos que a express~ao acima se simplica
para:
D
ei
p
2N
P
j
P
R
i1
P
X(1+
j )
E
d
D
ei
p
2N
P
j
P
R
i2
P
X(1
j )
E
d
=
Y
j;
cos
"r
2N
X
X(1 +
j )
#
cos
"r
2N
X
X(1
j )
#
Usando o fato de que cos(x) = e x
2=2 +O(x4), e rearran-
jando os termos do expoente camos com a express~ao:
exp
0
@
2
X
XX[1 + (1=N)
X
j
j
j ]
1
A+O(1=N)
Finalmente, inserindo esse resultado na express~ao para a
func~ao de partic~ao e realizando uma integrac~ao gaussi-
ana, temos:
hZnN id = Trj e
p2 log det[I+(=)(E+D)]
em que a matriz I e a identidade nn, E e a matriz nn
com todas as entradas iguais a 1 e:
D =
1
N
X
j
j
j
e a matriz dos overlaps. Vamos introduzir a identidade:
D. Ansatz Replica-Simetrico
[1] Arthur, W. B., 1994, Amer. Econ. Review (Papers and
Proceedings) 84, 406.
[2] Challet, D., and Y.-C. Zhang, 1997, Physica A 246, 407,
e-print: arXiv:adap-org/9708006v2.
[3] Coolen, A. C. C., 2005, The Mathematical Theory of Mi-
nority Games (Oxford University Press).
[4] Martino, A. D., and M. Marsili, 2006, Journal of Physics
A: Mathematical and General 39, 27.
[5] Risken, H., 1989, The Fokker-Planck Equation: Methods
of Solution and Applications (Springer-Verlag).
[6] Savit, R., R. Manuca, and R. Riolo, 1999, Phys. Rev.
Lett. 82, 2203.
[7] O nome do modelo, desenvolvido pelo pesquisador do
Santa Fe Institute W. Brian Arthur, deriva do nome de
um restaurante em Santa Fe, New Mexico, denominado
El Farol - www.elfarolsf.com
[8] O concurso de beleza de Keynes foi uma analogia utili-
zada por John Maynard Keynes em seu General Theory
entre o mercado nanceiro e um concurso realizado por
um jornal londrino. Fotos de diversas modelos eram apre-
sentadas no jornal e os competidores deveriam votar nas
mais belas. Aqueles que acertassem as modelos mais vo-
tadas ganhariam pre^mios. Segundo Keynes, assim como
no mercado nanceiro, nesse concurso e mais importante
descobrir as crencas medias sobre as modelos mais belas
do que efetivamente votar em suas opini~oes pessoais. Da
mesma forma, estrategias de ordem superior (descobrir
qual e a crenca media sobre as crencas medias sobre a
beleza das modelos) s~ao ainda melhores.
[9] Para que a situac~ao de minoria sempre seja bem denida,
vamos assumir que N e mpar
[10] O fator 1p
N
e adicionado para que varia^ncia de A(t) seja
uma variavel extensiva.
[11] Todas as guras apresentadas s~ao reproduzidas da re-
fere^ncia [3].
[12] Usamos a identidade:
R
Dxeixz = e z
2=2
serie de truques comuns nesse tipo de calculo. Em pri-
meiro lugar, introduziremos variaveis gaussianas para
linearizar o expoente (lembrando a denic~ao de
na
pagina 5):
hZnN id = Tr
Z
DX
D
ei
p
2
N
P
P
X
P
jf!i+jj g
E
d
:
Onde estamos usando a abreviac~ao[12]:
DX =
Y
;
dX
2np=2
exp( X2=2):
A media sobre a desordem pode agora ser calculada de
maneira trivial:
D
ei
p
2
N
P
P
X
P
jf!i+jj g
E
d
=
D
ei
p
2N
P
P
X
P
jf[Ri1 +Ri2 ]+[Ri1 Ri2 ]j g
E
d
Uma vez que Rig s~ao independetemente sorteadas do con-
junto f 1; 1g, temos que a express~ao acima se simplica
para:
D
ei
p
2N
P
j
P
R
i1
P
X(1+
j )
E
d
D
ei
p
2N
P
j
P
R
i2
P
X(1
j )
E
d
=
Y
j;
cos
"r
2N
X
X(1 +
j )
#
cos
"r
2N
X
X(1
j )
#
Usando o fato de que cos(x) = e x
2=2 +O(x4), e rearran-
jando os termos do expoente camos com a express~ao:
exp
0
@
2
X
XX[1 + (1=N)
X
j
j
j ]
1
A+O(1=N)
Finalmente, inserindo esse resultado na express~ao para a
func~ao de partic~ao e realizando uma integrac~ao gaussi-
ana, temos:
hZnN id = Trj e
p2 log det[I+(=)(E+D)]
em que a matriz I e a identidade nn, E e a matriz nn
com todas as entradas iguais a 1 e:
D =
1
N
X
j
j
j
e a matriz dos overlaps. Vamos introduzir a identidade:
D. Ansatz Replica-Simetrico
[1] Arthur, W. B., 1994, Amer. Econ. Review (Papers and
Proceedings) 84, 406.
[2] Challet, D., and Y.-C. Zhang, 1997, Physica A 246, 407,
e-print: arXiv:adap-org/9708006v2.
[3] Coolen, A. C. C., 2005, The Mathematical Theory of Mi-
nority Games (Oxford University Press).
[4] Martino, A. D., and M. Marsili, 2006, Journal of Physics
A: Mathematical and General 39, 27.
[5] Risken, H., 1989, The Fokker-Planck Equation: Methods
of Solution and Applications (Springer-Verlag).
[6] Savit, R., R. Manuca, and R. Riolo, 1999, Phys. Rev.
Lett. 82, 2203.
[7] O nome do modelo, desenvolvido pelo pesquisador do
Santa Fe Institute W. Brian Arthur, deriva do nome de
um restaurante em Santa Fe, New Mexico, denominado
El Farol - www.elfarolsf.com
[8] O concurso de beleza de Keynes foi uma analogia utili-
zada por John Maynard Keynes em seu General Theory
entre o mercado nanceiro e um concurso realizado por
um jornal londrino. Fotos de diversas modelos eram apre-
sentadas no jornal e os competidores deveriam votar nas
mais belas. Aqueles que acertassem as modelos mais vo-
tadas ganhariam pre^mios. Segundo Keynes, assim como
no mercado nanceiro, nesse concurso e mais importante
descobrir as crencas medias sobre as modelos mais belas
do que efetivamente votar em suas opini~oes pessoais. Da
mesma forma, estrategias de ordem superior (descobrir
qual e a crenca media sobre as crencas medias sobre a
beleza das modelos) s~ao ainda melhores.
[9] Para que a situac~ao de minoria sempre seja bem denida,
vamos assumir que N e mpar
[10] O fator 1p
N
e adicionado para que varia^ncia de A(t) seja
uma variavel extensiva.
[11] Todas as guras apresentadas s~ao reproduzidas da re-
fere^ncia [3].
[12] Usamos a identidade:
R
Dxeixz = e z
2=2
Sign up today - FREE
Mendeley saves you time finding and organizing research. Learn more
- All your research in one place
- Add and import papers easily
- Access it anywhere, anytime
Start using Mendeley in seconds!
Readership Statistics
1 Reader on Mendeley
by Discipline
100% Physics
by Academic Status
100% Ph.D. Student
by Country
100% Brazil


