Machine Learning
Contenidos
Machine Learning o Aprendizaje Automático (ML) es actualmente una las tendencias informáticas más utilizadas y comentadas, debido principalmente a los logros de esta tecnología en los últimos años. Se basa en el cambio sustancial de paradigma desde una resolución de problemas basados en reglas a una resolución basada en datos y el descubrimiento de patrones y reglas. La conducción autónoma, la visión por computadora y más notoriamente técnicas de procesamiento de lenguage natural como ChatGPT, que permite procesar lenguaje natural y obtener respuestas «casi» naturales y específicas, han puesto en las noticias del día a día esta tecnología.
Este artículo es un breve resumen del resultado de mis estudios y análisis bibliográficos, así como de las asignaturas que he realizado en estos ámbitos en las universidades de Las Américas y de Talca. Las imágenes en general son propias y utilizadas en estos cursos, y los fundamentos matemáticos han sido descartados para simplificar la lectura. En este artículo y por razones de mejorar la lectura omitiré las citas respectivas y la información de origen estará en la sección de referencias. El objetivo es entregar una lectura simple dentro de lo posible para asimilar un mejor entendimiento de estas tecnologías.
El contenido de este artículo puede ser utilizado con fines pedagógicos siempre que se cite su origen.
ML e Inteligencia Artificial
¿Cómo se relaciona esto con la inteligencia artificial? pues de muchas formas, en primer lugar no son lo mismo, aunque muchas veces se confunden y se indica que ML (y sus técnicas) son Inteligencia Artificial. Aclaremos en primer lugar que IA es de por sí una ciencia que puede ser conceptualizada ya sea en base a procesos de razonamiento y procesos mentales, donde la neurociencia tiene la base de esta, o en base a procesos relacionados con la conducta, orientadas a la consecución de tareas propiamente humanas.
La inteligencia artificial es la ciencia que otorga el paraguas al aprendizaje automático, ya que este es una metodología (conjunto de procesos y técnicas) que se aplica en ciertas áreas de la IA.
Algoritmo
Un algoritmo no es más que una secuencia de instrucciones definidas, acotadas y organizadas en una secuencia determinada que permiten la resolución de problemas. Además, un conjunto de reglas a seguir para cumplir una tarea. Esta serían las definiciones apropiadas para el área de informática, donde esto se traduce en una serie de líneas de código para conformar una serie de instrucciones a un computador para ejecutar un cálculo o tarea. También aplica en IA ya que necesita de algoritmos para resolver los problemas planteados.
Data Data Data!!
Todas las técnicas mencionadas en este artículo no son más que algoritmos vacíos sin nada que ofrecer a menos que se basen en datos relevantes, congruentes y eficientes. Machine Learning no genera ningún resultado viable sin datos de calidad. Por tanto, antes de embarcarse en la determinación casi irreflexiva de elegir el algoritmo adecuado al problema a enfrentar, date un tiempo de reflexión y piensa en tus datos.
La primera etapa de un proyecto de ML o de Ciencia de Datos (ya veremos cómo se relacionan estos términos) esta centrada en los datos y en estadística avanzada (si quieres hacer un trabajo óptimo). Lo primero, determinar en forma exacta si los datos recopilados son atingentes al objetivo que se busca. Contestar una serie de preguntas que pueden aclarar si tenemos lo suficiente serían a modo de ejemplo:
- ¿El dominio de los datos obtenidos son suficientes para lo que se busca encontrar?
- ¿Son los datos correctos?
- ¿Cuántos valores nulos tengo? ¿debo imputar y bajo que técnica?
Por supuesto hay más preguntas que las presentadas acá.
Para saber más