Yahtzee Probabilidade
Santa trouxe aos meus filhos o jogo de Yahtzee para o Natal. Nós temos jogado muito à noite. Quando um Yahtzee é rolado, os meus filhos ficam loucos. Neste post de blog eu vou ver a probabilidade de enrolar um Yahtzee. |
Yahtzee é um jogo jogado com cinco dados de seis lados. Um jogador joga os dados, examina os resultados e pode manter quantos dados quiser, relançando os restantes. Após o segundo lançamento, o processo é repetido (se desejar, o jogador pode pegar os dados na primeira rodada). Depois de (até) três lançamentos, os dados são pontuados de acordo com várias categorias. O Yahtzee (marcando 50 pontos) é obtido obtendo os cinco dados iguais. |
Premissas
Vamos assumir que o jogador é um jogador inteligente, e em cada ponto de decisão faz as escolhas mais inteligentes possíveis.
A probabilidade de obter um Yahtzee em uma única jogada é fácil de calcular. Existem cinco dados, então qualquer que seja o primeiro dado lançado, há uma chance de 1/6 de que o segundo dado seja o mesmo número. Se isso ocorrer, há uma chance de 1/6 de que o terceiro dado seja o mesmo, idem ao quarto e ao quinto.
Então, a probabilidade de Yahztee em uma jogada é de 1/6 x 1/6 x 1/6 x 1/6 = 1/1296.
Com três jogadas e mantendo, no entanto, as coisas ficam um pouco mais complicadas. O número de dados que lançamos a cada vez pode ser alterado, e há muitas combinações possíveis a considerar. Porque o estado dos dados no início de cada jogada é independente de como os dados foram lançados, esta é uma chance perfeita de lançar uma das minhas ferramentas favoritas, a Corrente de Markov (para mais informações sobre isso, veja meus lançamentos anteriores em CandyLand, e Rampas e Escadas).
Antes de mergulharmos na Corrente de Markov, no entanto, nos beneficiará examinar as várias maneiras pelas quais as combinações de dados podem ser lançadas. Este exercício simplificará muito a criação da Matriz de Transição (confie em mim). Aqui vamos …
2 dados |
Este é o caso trivial. Existem apenas dois padrões para a forma como dois dados podem ser lançados. Eles ou combinam, ou não combinam. Há uma chance de 1/6 de que o segundo dos dois dados combine com o primeiro e, inversamente, há uma chance de 5/6 de que ele não combine. As probabilidades, é claro, têm que somar até 1 (um dos dois eventos deve ocorrer).
Outra maneira de ver isto é que existem 36 combinações possíveis para dois dados a serem lançados. Em seis destas combinações {1,1}, {2,2}, {3,3}, {4,4}, {5,5}, {6,6} os números são os mesmos, e em 30 destas combinações os dados são diferentes.
Estes resultados são mostrados graficamente na imagem acima. Há 6/36 chances dos dois dados serem iguais, representados como {A,A}, e 30/36 chances deles serem diferentes, representados como {A,B}
3 dados
Isto se torna um pouco mais complexo, mas não muito. Aqui há três sabores possíveis de resultado para os três dados: Ou são todos iguais, ou são todos diferentes, ou haverá dois de um número e um de outro. Existem 216 maneiras possíveis de lançar três dados (6 x 6 x 6).
Podemos calcular a probabilidade de todos serem iguais, facilmente, como 1/6 x 1/6 = 1/36 (O segundo dado corresponde à primeira 1 vez em 6, e o terceiro dado corresponde, novamente, 1 vez em 6).
Alternativamente, podemos imaginar que, das 216 maneiras possíveis que os dados poderiam pousar, há seis maneiras possíveis quando todos eles são iguais: {1,1,1}, {2,2,2,2}, {3,3,3,3}, {4,4,4}, {5,5,5}, {6,6,6}.
A probabilidade de todos eles serem diferentes pode ser calculada usando a seguinte lógica: O primeiro dado pode ser o que quiser, então para o segundo há uma probabilidade de 5/6 de não ser o mesmo número que o primeiro dado. Finalmente, há uma probabilidade 4/6 de que o terceiro dado seja diferente para os dois primeiros. Assim, a probabilidade de todos os dados serem diferentes é de 5/6 x 4/6 = 20/36, o que pode ser não simplificado para 120/216. Existem 120 combinações possíveis dos 216 resultados possíveis onde os três dados são diferentes {A,B,C}.
Porque sabemos que o total de todas as probabilidades para a forma como três dados são lançados deve somar até 1.0 podemos deduzir que a probabilidade de dois dos dados serem iguais {A,A,B} é 90/216 (que é 1 – 6/216 – 120/216).
(Se você quer se convencer disso, pense desta maneira: Há seis valores possíveis que A poderia ser, cinco valores possíveis do que B poderia ser, e três escolhas possíveis do que B poderia ser. Isto é 6 x 5 x 3 = 90 combinações do 216).
4 dados
As coisas estão começando a ficar um pouco mais complexas agora. Elas podem ser todas iguais, todas diferentes, três de um tipo, dois lotes de dois pares, ou um par com dois singletons diferentes.
Existem 1296 maneiras que quatro dados podem ser dispostos (6 x 6 x 6 x 6). Os resultados são mostrados abaixo:
Temos de ter um cuidado extra aqui, porque não queremos duplicar a contagem. Ao contar os dois lotes de dois pares, precisamos ter certeza de não contar inadvertidamente {5,5,5,5} como dois conjuntos de cinco pares e colocar isto no balde {A,A,B,B}, porque é realmente quatro do mesmo tipo e precisa estar no balde {A,A,A,A}. Se fizermos a contagem dupla, as probabilidades serão maiores que 1,0!
Derivar a tabela acima pode ser feito de várias maneiras. Aqueles de vocês que estudaram matemática na universidade podem chegar a uma expansão binomial para o cálculo das permutações. Alternativamente, como discutimos na página Análise de Risco, o número de combinações é tão pequeno (apenas 1296) que você pode querer simplesmente forçar todas as combinações em código e contá-las.
É na verdade um bom exercício mental para trabalhar através da derivação desses números para se convencer de que os números estão corretos. Por exemplo {A,A,A,A,A} é 1/6 x 1/6 x 1/6 para as chances de que o segundo, terceiro e quatro dados coincidam com o primeiro. (Pensamento alternativo, é que existem apenas seis formas de obter quatro iguais = 6/1296).
Para três iguais {A,A,A,B} existem seis possíveis números que A poderia ser, e cinco possíveis números que B poderia ser, e quatro locais para os dados B, que é 6 x 5 x 4 combinações = 120/1296.
Para todos os dados serem diferentes {A,B,C,D} há 5/6 chances do segundo dado ser diferente do primeiro, e 4/6 de o terceiro ser único, e 3/6 chances do quarto ser. 5/6 x 4/6 x 3/6 = 60/216 = 360/1296.
Nota de interesse – Como um aparte aqui, ao lançar quatro dados, o resultado mais provável é que você obtenha um par, e há um maior que 72.2% de chance de você obter um par (720+90+120+6)/1296
>
5 dados |
Agora as coisas estão ficando um pouco ocupadas! Há 7776 combinações possíveis para cinco dados. Os resultados são mostrados abaixo. No interesse da brevidade, eu não vou obtê-los todos aqui (talvez em um blog futuro), e vou simplesmente mostrar os resultados para que possamos voltar à Markov Chain.
Nota interessante – A probabilidade de enrolar um FullHouse em um rolo é de 300/7776 cf. Quatro de um tipo em apenas 150/7776. De acordo com as nossas regras, um full house marca 25 pontos e (no máximo), os quatro do mesmo tipo podem marcar 30 pontos (todos os seis – excluindo o bónus Yahtzee), por isso o full house é uma recolha de pontos fácil, sendo duas vezes mais fácil do que obter quatro do mesmo tipo!
Nota de Interesse – Com cinco dados, há 7056/7776 hipóteses de obter um par ou melhor na sua primeira jogada (90.7%)
Voltar para Markov
Para realizar nossa análise de Markov, precisamos criar uma Matriz de Transição que define a probabilidade de mover-se entre cada estado.
Como os estados, vou selecionar o número de dados correspondentes no conjunto, então temos 5 estados: 1,2,3,4,5 (Aqui, “1” dado correspondente também pode ser descrito como um singleton). Isto resulta em uma matriz de 25 elementos.
Nossa matriz será de natureza triangular superior (fizemos a suposição de um jogador inteligente assim, se houver um lançamento de três de um tipo, não vamos sugerir que o jogador re-rola parte disto a fim de chegar a um Yahtzee!) A Matriz de Transição irá mostrar as probabilidades de se mover de qualquer estado para o mesmo estado, ou para um superior. Aqui está a Matriz de Transição. Precisamos preencher cada local contendo um ‘?’ com a probabilidade de mover-se de entre o estado representado pelo número da coluna para o estado representado pelo número da linha. (Todas as outras localizações têm probabilidade zero). Aqui vamos … |
|
As primeiras entradas são fáceis de preencher. A probabilidade de passarmos do estado 5 para o estado 5 é 1.0 Uma vez que alcançamos um Yahtzee, vamos mantê-lo e não lançar mais nenhum dado, então há 100% de certeza que vamos manter neste estado! Se atualmente tivermos 4 dados correspondentes, há uma chance de lançarmos o número correto para torná-lo 5, e correspondentemente um 5/6 de ficarmos no estado 4. A natureza estocástica da matriz de transição é mantida porque a linha desta matriz soma até 1.0 (Algo tem que acontecer, e será uma dessas mudanças de estado). |
Para o estado 3, há dois dados a serem lançados novamente, dando 36 combinações possíveis. (Relembre a seção de combinatrónica acima). Existe uma chance de 1/36 de que ambos os dados coincidam com os três do tipo atual para fazer um Yahtzee e esta probabilidade é colocada na linha 3 e na coluna 5. Existe uma chance de 25/36 de que o jogador ainda tenha três do mesmo tipo no final do próximo lançamento (chance de 5/6 de perder com o primeiro dado multiplicado por 5/6 de perder com o segundo). Finalmente, existe uma chance de 10/36 de conseguir um número adicional para fazer quatro do mesmo tipo. Isto é 1/6 x 5/6, e isto pode ser conseguido de duas maneiras diferentes (ou o primeiro dado coincide, ou o segundo coincide). |
> |
As coisas estão ficando um pouco mais complicadas agora, então vamos diminuir a velocidade. Passar do estado 2 para o estado 5 requer todos os três dados relaminados combinando com o par atual. Isso ocorre com probabilidade 1/216 (que é 1/6 x 1/6 x 1/6). Simplesmente ir do nada correspondente, (estado 1), para o estado 5, é o equivalente a lançar um Yahtzee de uma só vez (porque todos os dados são relançados). Isto é 1/1296, calculado como (1/6 x 1/6 x 1/6 x 1/6). |
> |
Podemos preencher mais dois coeficientes. Se você tiver azar, e não tiver nada correspondente (estado 1), e voltar a lançar todos os dados, a probabilidade de não obter nada correspondente novamente é de 120/1296 (Esta é 5/6 chances do segundo dado não corresponder, seguido de 4/6 para o terceiro e 3/6 do quarto, e 2/6 para o quinto). As chances de lançar quatro de um tipo em um único lançamento são de 25/1296 (Que é 150/7776. Lembra-se de voltar à secção de Combinatrónica? É calculado obtendo quatro dados iguais: 1/6 x 1/6 x 1/6, com o último dado não correspondendo a 5/6, e há cinco formas possíveis de formar isto com os cinco locais possíveis para B no conjunto {A,A,A,A,A,B}. Se não for claramente óbvio, as probabilidades na linha superior (mudando do nada para qualquer outro estado), são as probabilidades para o resultado do primeiro rolo. |
A probabilidade de obter três de um tipo em um rolo é de 250/1296. Isto é um pouco mais desafiador de calcular, e temos que ter cuidado. Isto ocorre em um de dois padrões {A,A,A,B,B} e {A,A,A,A,B,C}. Referindo-se à secção combinatória acima (lembre-se, eu disse que seria útil?), podemos ver que {A,A,A,A,B,B} ocorre 300/7776 vezes (a casa cheia) e {A,A,A,A,B,C}. (três de um tipo) ocorre 1200/7776. Adicionando estes juntos (a forma probabilística de dizer OR) obtemos 1500/7776, o que reduz para 250/1296. Para preencher o último elemento desta linha (obter um par), mais uma vez temos de ter cuidado. Há dois conjuntos a considerar: {A,A,A,B,C,D} e {A,A,B,B,C}. (Par Único e Dois Pares). Já que vamos para um Yahtzee, rolamos o dos pares juntamente com o singleton. A probabilidade de obter um par é 1800/7776 + 3600/7776 = 5400/7776 ou 900/1296). Também é alívio saber que todas as probabilidades nesta linha somam até 1.0 (120/1296 + 900/1296 + 250/1296 + 25/1296 +1/1296). |
Transição de um par (estado 2) para quatro de um tipo (estado 4) é probabilidade 15/216. Existe uma probabilidade de 1/6 de que um dos moldes corresponda, depois outra 1/6 de que outro, multiplicada pela probabilidade de 5/6 de que o molde final não corresponda. Há três formas possíveis de qual dos dados 5/6 é, então a probabilidade final = 3 x 1/6 x 1/6 x 5/6 = 15/216. |
Agora os dois últimos complicados. Lendo um pouco na internet, é aqui que as pessoas parecem deslizar em seus cálculos. A complicação surge porque, ao relançar três dados, você pode querer “pular o navio” sobre o que você está almejando. Por exemplo, se você lançou um par no seu primeiro lançamento, manteve o par e relançou três dados, e esses três dados apareceram todos iguais (mas não iguais ao par, caso contrário isso seria Yahtzee!), então no próximo lançamento você gostaria de manter os três do mesmo tipo e relançar o par. Esta sutileza modifica as probabilidades. Vamos trabalhar através disto – Nós mantivemos um par e relançamos os três dados. Lembre-se de nossos três dados combinatrónicos que três dados aparecem todos iguais com probabilidade 1/6 x 1/6 = 1/36 = 6/216, mas em um destes casos, este número rolado será o mesmo que o par (causando um Yahtzee), então precisamos subtrair este caso. Assim, a hipótese de conversão de dois para três é 6/216 – 1/216 = 5/216. |
Para completar o coeficiente de transição de um par (estado 2) para ficar como um par (estado 2), precisamos da probabilidade básica disto, que é simplesmente 5/6 x 5/6 x 5/6 (todos os três dados falham, correspondendo ao par), e disso, precisamos subtrair a chance de que todos esses três dados sejam iguais e não formem um Yahtzee (5/216), então o resultado final para esse elemento = 125/216 – 5/216 = 120/216.
Similiarmente, o inverso deste truque para a probabilidade de transição de um estado de par 2 para três de um estado de tipo 3. Aqui a probabilidade básica de passar do estado 2 para o estado 3 é 75/216 (três dados são lançados, com 1/6 de chance de uma partida, depois duas 5/6 chances de um erro, e há três combinações de maneiras que podem ser alcançadas que é 3 x 1/6 x 5/6 x 5/6). A esta probabilidade básica de 75/216, precisamos adicionar a probabilidade de 5/216 a partir de cima que temos a três de um tipo através desta rota alternativa.
Assim, o elemento final necessário para completar nossa Matriz de Transição do estado 2 para o estado 3 é 75/216 + 5/216 = 80/216.
É também um alívio calcular que as probabilidades nesta linha totalizam 1.0! (120/216 + 80/216 + 15/216 + 1/216). Isto ajuda a confirmar que nossos cálculos estão corretos.
Nossa Matriz de Transição está agora completa!
Matrix Multiplicação
Agora introduzimos um vetor de coluna de identidade e multiplicamos isto pela Matriz de Transição. A saída vetorial de linha resultante mostra as probabilidades da distrubuição dos estados em que os dados poderiam estar. Podemos agora pegar esta saída e usá-la como entrada novamente e desta vez a saída é a sobreposição das probabilidades para os dados no final do segundo lançamento. Para obter a probabilidade de obter um Yahtzee em (ou antes) três lançamentos, nós multiplicamos uma última vez e lemos o resultado do primeiro elemento (estado 5) no vetor de saída final.
(A partir deste ponto, estou mudando para decimais/percentagens para representar as probabilidades porque as frações envolvidas são muito pouco lucrativas para entrar e ler).
Resultados
A probabilidade de obter um Yahtzee é de 4,6029%
Gráficos de Predefinições
Se você perdeu o seu rolo Yahtzee, o que acontece se você rolar novamente? (como os meus filhos às vezes tentam fazer!) E outra vez? E de novo? …
Below é um gráfico que mostra a percentagem de hipóteses de conseguir um Yahtzee em n-rolls. O eixo x é o número de rolos, e o eixo y mostra a probabilidade percentual.
A curva assímptota a 100%, e cruza mais de 50% por rolo #10. Para estar 95% confiante de rodar um Yahtzee você precisa de 23 rolos.
|
Amavelmente você perde uma tentativa de Yahtzee. Qual é a divisão das probabilidades? Como você é para acabar com o Four of a kind ao atirar para o seu Yahtzee? Esta informação é fácil de obter lendo o valor do vector de saída da cadeia de Markov para o estado 4. (A chance de você acabar com Quatro da espécie em três rolos é de 24,476%, e Três da espécie é de 45,240%). A tabela à esquerda mostra a repartição percentual para os primeiros 25 rolos. Below são os mesmos dados apresentados em formato gráfico. Note que após 9 rolos, o Yahtzee se torna o evento mais provável, e a chance de acabar com um par ou Singleton rapdily cai em ruído. |