Modelos de Machine learning.

Jornada 16

Al final he automatizado el proceso y he decidido poner 16 modelos de Machine Learning en base al entrenamiento con la base datos actualizada. Llevo algunas semanas probándola.

Os los dejo en un Data Tables desde este enlace. Para que podáis utilizarlos.

Algunos apuntes de la Data Tables:

  1. Mejor utilizar un ordenador con una pantalla grande que el móvil.
  2. Solo los pondré los fines de semana. Normalmente el jueves y si puedo actualizo viernes y sábado.
  3. Cada modelo lleva asociada su probabilidad al lado, por la que podréis ordenar los signos de los partidos de + a – probabilidad o al revés. Algunos modelos no sacan esta probabilidad. No es un error, son así.
  4. Podéis seleccionar el numero de partidos que salen en la tabla. Si queréis los 5 mejores de un modelo, se seleccionan 5 partidos y se ordenan por probabilidad de más a manos. Lo podéis hacer con cualquier cantidad de partidos y ordenarlos de mejor a peor o viceversa.
  5. Podéis busca un partido en concreto mediante el buscador de la tabla.

Y poco más os tengo que contar.

Para que os hagáis una idea he jugado 12 Jornadas y estos son los aciertos de los modelos de mejor a peor. Iré actualizando esta tabla.

MODELOMEDIATOTAL
FilteredClassifier7,8394,00
VIAREGRESION7,7593,00
NEURAL7,7593,00
RandomSubSpace7,6792,00
SMO7,6792,00
REGRESION7,6792,00
MultiClassClassifier7,5891,00
REPTREE7,0885,00
BAYES7,0084,00
OneR6,9283,00
J486,7581,00
RandomCommittee6,5879,00
PART6,5879,00
BAGGING6,5078,00
LAZY6,0873,00
RANDOMTREE5,8370,00
ESTADISTICAS A J15

Un saludo a todos y mucha suerte con las combinaciones. Lamento no haber arrancado antes, pero he tenido unos meses complicados.

18 opiniones en “Modelos de Machine learning.”

  1. Genial el enfoque de usar redes neuronales y otros sistemas apoyándose en la IA, está claro que la labor de entrenamiento ocupa mucho tiempo, hace falta una tarjeta gráfica actualizada, con muchos CUDA cores !!! Lo que ahorra mucho tiempo de cálculo. Gracias por tu inmenso trabajo. Un abrazo desde Canarias.

    1. ¿Qué tal amigo Juan Carlos?, gracias a ti por seguir la página. ¿Sigues programando con QB64?.

      Pues es interesante el enfoque, aunque no es la panacea, no creas. Mis modelos son bastante modestos, pero bueno ahí están sus predicciones. Y sí, lo más costoso es el entrenamiento de algunos modelos, depende del tamaño de la información con la que trabajes. Aunque para mi lo más costoso es automatizar procesos para poderlo colgar en la página sin que me lleve mucho tiempo.

      Un saludo amigo y suerte con la temporada.

  2. Estoy sacando mis propios pronosticos la idea es algo parecida a la tabla de dobles que tienes aunque solo uso porcentajes

    Lo que saco son tendencias

  3. Yo también creo que los modelos se comportan diferente con la liga española ¿ has comparado la media de resultados pronosticando otras ligas?

    También en notado que las semanas que los modelos tienen de 10 aciertos o más es cuando se dan resultados logicos

    1. La base de datos con la que entreno los modelos es de unos 13000 resultados de porcentajes, con ligas de todos los boletos que han entrado en las quinielas. Una opción interesante, que igual miro para más adelante es filtrar solo los partidos de esa base de datos que entran en el boleto y realizar el entrenamiento de los modelos de aprendizaje. De esta forma solo se tendrían en cuenta los partidos anteriores de los del boleto. Sería una forma de tener en cuanta solo partidos de cada liga, aunque claro en esta saldrían partidos ingleses e italianos. Lo más interesante sería hacer una base de datos separada de cada competición, pero no me daría tiempo. Incluso si considerase los partidos anteriores en los que participa cada equipo del boleto, tendría que echar unas cuantas horas entrenando los modelos cada semana. Inviable.

      Y tienes razón, hay una correlación muy clara entre los signos más evidentes y el acierto de los pronóstico de los modelos, no tan clara en el modelo de árboles, el modelo de árboles no correlaciona tanto con la posición de probabilidad de la columna premiada.

      Normalmente saco el numero de orden de la columna premiada y si se saca la correlación, teniendo en cuenta que el numero de orden sea una propiedad que indique la dificultad de la columna, con respecto a los aciertos de los modelos, claramente los modelos tienen una correlación de un 50 o 60% con dicha valoración, menos el modelo de árboles. Es lógico, por otra parte. Los modelos no van a sacar las sorpresas.

      Un saludo Luis y gracias por tus apreciaciones y por visitar la página.

  4. ALPEDRETE, CRACK. LA IDEA DEL MACHINE LEARNING, EN VERDAD, ME PARECE MUY INTERESANTE, DE ENTRADA, HABRA QUE DEJAR QUE EL TIEMPO, CON LA LOGICA Y EL AZAR, PURO Y DURO, PUEDAN REVALIDARLAS, SINO TODAS, ALGUNA DE ELLAS. GRACIAS POR TU TRABAJO. UN SALUDO.
    ABG

    1. Me alegro que te guste la sección Amador. La idea es ir probando con esas columnas para condicionar las apuestas, a ver si se afina y da Rentabilidad alguna jornada.

      Gracias a ti por visitar la página.

    1. Hola Pedro. Los pronósticos múltiples son la combinación de los signos de los 4 modelos y hay semanas que darán más múltiples y otras semanas menos. No todas las semanas van a salir los mismos múltiples. Yo con los múltiples que salen elijo una par de combinaciones. Está semana he tenido lio y no me ha dado tiempo.

      Si hay muchos múltiples, es que los modelos están poco de acuerdo en el pronóstico. Esta Jornada 4 hay dos idénticos y tienen bastante acuerdo, Neural y Árboles. Yo me atrevería a decir, con mucho respeto a los resultados que se puedan dar y que al final puede salir todo lo contrario, que las semanas con mucho acuerdo entre modelos y pocos múltiples, serían jornadas fáciles y las jornadas en desacuerdo y con muchos múltiples, jornadas difíciles.

      De todas formas si quieres jugar la de 2 triples y 6 dobles. Puedes hacerlo añadiendo un triple y un doble, según tu criterio.

      Un saludo Pedro y mucha suerte con las combinaciones.

  5. Hola me parecen muy interesante estos temas pero no entiendo mucho

    ¿Puedes usar estos modelos para descartar resultados?

    Por ejemplo si en determinado partido queremos usar 1 doble
    hacer lo contrario y preguntar que resultado no se dará

    Si red o bayes nos dicen que en ese partido no habrá empate podríamos jugar ese partido a doble 12

    Saludos

    1. Hola Luis, pues ya me lo había planteado alguna vez, pero no he probado la verdad. El tema es que estos modelos los tienes que entrenar con partidos disputados con un solo resultado. De alguna forma deberías de añadir otro signo al signo sucedido y elegirlo en base a algún criterio, porque no es un signo sucedido, debería de ser el más probable entre los dos no sucedidos por ejemplo y codificar la base de datos de entrenamiento de tal forma que al signo sucedido se le añadiese otro para conformar un doble. En realidad es lo mismo descartar un fijo que elegir un doble. Sería un modelo que eligiese 14 dobles posibles.

      Por ejemplo imaginemos que codificamos la base de datos de esta forma, añadimos al signo sucedido el más probable: Girona-Betis 50,30,20 –> 1, como la X es el signo más probable de los dos no sucedidos, el resultado del partido sería 1X. Esto lo tendría que hacer con todos los partidos de la base de datos, corrigiendo problemas como que los dos partidos no sucedidos no tengan la misma probabilidad, con lo cual habría que elegir con otro criterio de la base de datos. Imagina Girona-Betis 50,25,25 —> 1, no podría elegir según ese criterio y debería de buscar otro o descartar ese partido para el entrenamiento del modelo.

      Me parece muy interesante Luis, muchas gracias por la sugerencia, me lo apunto para desarrollarlo durante la temporada. Pero debería ser en otro artículo de la página.

      Un saludo y gracias por visitar la página

        1. Bueno, algo de tiempo, sobre todo para entrenar los modelos. Pero creo que saco un hueco para irlo haciendo, me parece muy interesante el tema de pronosticar dobles que has comentado. Además tengo un tipo de combinaciones que llevo tiempo con ganas de poner, son combinaciones con tolerancia a fallos en los dobles, es decir que si fallas dobles te siguen dando la posibilidad de entrar en premios. Gracias de nuevo Luis, por la sugerencia.

          1. Hola las combinaciones que comentas con tolerancia a fallos será una sección nueva podrías explicar más

            Gracias

          2. Bueno no sé si tolerancia al fallo para mí, es lo que entiende todo el mundo en las quinielas. Para mi la tolerancia al fallo es que si fallas algún signo del pronóstico que este entre los margenes establecidos, la combinación te siga dando el premio esperado. Esto se consigue con columnas base a mi modo de ver. Con el tema de los dobles, se trata de triples reducidos por una columna de dobles para asegurar el acierto aun fallando algún doble. No sé si me explico.

            Tengo que echarlo un vistazo y ver que combinaciones tengo guardadas y lo más importante es que tengo que programar el adaptador para este tipo de combinaciones, esto me llevará algo de tiempo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Uso de cookies

Utilizamos cookies propias y de terceros para obtener información estadística. Si estás de acuerdo pulsa en Aceptar. Más info

ACEPTAR
Aviso de cookies