En un esfuerzo pionero, investigadores de la Universidad de Michigan, el Instituto Nacional de Astrofísica de México y el Instituto de Óptica y Electrónica de México han empleado modelos de inteligencia artificial entrenados en el habla humana para intentar desentrañar el lenguaje de los perros. Los resultados, presentados la semana pasada en una conferencia internacional, sugieren que los modelos de IA podrían proporcionar claves valiosas para comprender mejor los lenguajes de los animales, aunque de manera limitada. "Hay tantas cosas que aún no sabemos sobre los animales que comparten este mundo con nosotros", comentó Rada Mihalcea, directora del Laboratorio de IA de la Universidad de Michigan, en un comunicado de prensa. "Los avances en IA pueden revolucionar nuestra comprensión de la comunicación animal, y nuestros hallazgos indican que no necesariamente tenemos que empezar desde cero".
Uso de modelos de voz de IA
El estudio se centra en el uso de Wav2Vec2, un modelo de voz de IA de última generación, para identificar la emoción, género y raza de los perros a partir de sus ladridos. Para entrenar y validar el modelo, los investigadores utilizaron dos conjuntos de datos diferentes. Uno de ellos consistía en un modelo entrenado exclusivamente con ladridos de perros, mientras que el otro fue un modelo previamente entrenado en casi 1000 horas de habla humana y posteriormente afinado con ladridos. Este enfoque permitió a los científicos comparar la efectividad de ambos modelos. Los resultados mostraron que el modelo de IA que incluía el entrenamiento en habla humana tuvo un mejor desempeño, logrando identificar la emoción de un perro con un 62% de precisión, la raza con un 62% de precisión y el género con un 69% de precisión. Además, el modelo pudo identificar a un perro específico dentro de un grupo con un 50% de precisión, superando así al modelo entrenado únicamente con datos de perros.
La interpretación del contexto
Los investigadores exploraron cómo las vocalizaciones de los perros podrían estar vinculadas a contextos específicos. Estudios previos han demostrado que los sonidos emitidos por monos y perritos de las praderas pueden predecirse según el contexto de la situación. En este estudio, se intentó clasificar las vocalizaciones caninas en categorías como ladridos agresivos, ladridos normales, chillidos y gruñidos negativos, con la intención de entender mejor las emociones expresadas por los perros. A pesar de que el estudio no cubre todas las posibles emociones caninas, se seleccionaron aquellas vocalizaciones que eran más prevalentes en el conjunto de datos disponible.
Mihalcea destacó la relevancia de usar modelos de procesamiento de habla entrenados en humanos para abrir nuevas posibilidades en la comprensión de los ladridos de los perros. En el futuro, el equipo de investigación planea ampliar el estudio para incluir una mayor variedad de razas, emociones y especies, con el objetivo de profundizar en el alcance de esta tecnología. Aunque los resultados actuales no son definitivos en cuanto a la interpretación completa de los ladridos, representan un paso prometedor hacia una mayor comprensión del lenguaje de los animales.