Portada » bits&bytes » ¿Qué es el entrenamiento de la IA?
¿Qué es el entrenamiento de la IA?

¿Qué es el entrenamiento de la IA?

Este concepto tan llamativo, en el que nos viene a la cabeza algo así como entrenar a un robot, es una parte indispensable de los sistemas de IA, de alguna manera, la IA permite crear más IA, y lo hace a base de entrenamiento.

El entrenamiento de la IA puede ser llevado a cabo por diferentes métodos, el más común es el realizado por una máquina para partiendo de unos elementos y unos resultados extraer el razonamiento que le hace llegar a los resultados.

Pongamos unos ejemplo clarificadores en los siguientes párrafos.

Entrenamiento de la IA por máquinas

Entrenamiento de la IA por máquinas

A la máquina A se le dice que deduzca la pregunta ante la siguiente afirmación tenemos dos números aislados que son el 3 y 5, y el resultado al que queremos llegar es 35.

La máquina entonces debería someter sus circuitos a todo tipo de operaciones de prueba y error, por ejemplo comenzando por sumar 3 + 5, lo que le daría 8, por lo que difiere de 35 y no es la pregunta formulada.

Luego restaría 3-5 y vería que tampoco son 35, así sucesivamente hasta que viese, que quitando la y, y juntando los números aislados, obtiene 35, por lo que podría deducir que la interjección «y» puede ser equivalente a la instrucción «junta los dos elementos poniendo uno al lado de otro»

La máquina habría sido entrenada para dar respuestas más rápidas a preguntas del estilo 2 y 2 son 22, 100 y 3 son 1003, etc.

Entrenamiento de la IA por humanos

Entrenamiento de la IA por humanos

si a la IA le pido que me de un listado 10 números pares no consecutivos e inferiores a 100, ella podría darme números del 0 al 99, o mejor dicho del – infinito al 99 incluido ya que si nos ceñimos a la matemática pura -2 también es un número inferior a 100.

Pues bien, la IA tampoco tiene por que saber que es par y no par, sabe que -2 3 5 y 8 son números, que 6 es mayor que 5 y 4 menor que 5, así que entrenarla sería que tras la pregunta esa IA nos fuese lanzando resultados.

Estos resultados podría calcularlos en cualquier orden, quizá en un orden aleatorio, o un orden ordenador, diciendo 100, y 10 números, si dividimos 100 entre 10 nos da unos saltos de 10, por lo que el primer par de 0 más 10 sería 10 y así hasta llegar a 100 pero como el humano no especifica signo y dice que los mismos son menores a 100 le ofreceremos 99.

Así su respuesta sería 10 20 30 40 50 60 70 80 99

El humano le devolvería los resultados diciendo 99 no es par, explicando que un número par debe ser divisible entre 2 sin dar decimales.

Entonces la máquina aprende lo que es par, hay que dividir cada resultado entre 2 y ver que el resultado es un número entero para validar que este sea eso que el humano llama «número par»

En ese momento tiene dos opciones, y como el humano no ha dicho nada sobre números negativos el sistema con su mente ordenada piensa, entonces empezaremos por -50 hasta llegar a 50. Así podré ofrecer 10 números pares inferiores a 100.

Entonces nos daría como respuesta: -50 -40 -30 -20 -10 10 20 30 40 50

Ahora nosotros, los humanos, le devolvemos los resultados evaluados, diciendo lo que está bien y lo que está mal. Marcando todos los negativos como errores.

La IA cogerá nuestros resultados y tratará de extraer una regla, al ver que todos los números con signos negativos han sido invalidados aprenderá a que ante la pregunta de dame 10 números inferiores a 100, el humano sobreentiende que deben ser números positivos.

La IA entonces buscará el último número par anterior a 100, que es 98 y nos le irá restando de 10 en 10, dándo como resultado:

8 18 28 38 48 58 68 78 88 y 98

El humano lo validará y la IA habrá aprendido con este entrenamiento muchas cosas, por supuesto la IA sabe que las respuestas no son únicas, y entonces irá anotándose todo para ante la próxima misma pregunta ofrecer otras cadenas de resultados para ver que es lo que está bien y lo que está mal.

Si esta IA tiene como acceso muchas preguntas y muchas respuestas, como por ejemplo tienen los motores de búsqueda en internet, sabrán evaluar con mayor acierto las respuestas.

Posteriormente una máquina puede especializarse en un tipo de respuestas, pudiendo enseñar a otras máquinas sus conocimientos mediante entrenamientos entre ambas máquinas.