La revolución silenciosa: La IA que «escucha» las enfermedades en las granjas antes que el oido humano
La aplicación de la inteligencia artificial en avicultura aplicada en concreto al análisis de imagen y sonido como indicadores objetivos de salud y bienestar en aves de producción es una de las líneas actuales de investigación de mayor aplicación práctica para toda la cadena de producción avícola.
Es en este contexto, que en el marco del proyecto EBroilerTrack, liderado por ITAVI, han publicado los resultados de un interesante estudio, enfocado en el uso de análisis de imagen y sonido para monitorear la salud y el bienestar del pollo de engorde. Los autores detallan el desarrollo de algoritmos de inteligencia artificial que permiten el seguimiento individual de las aves en granjas comerciales, evaluando indicadores como la velocidad de desplazamiento y el tiempo en áreas de interés. Además, el estudio investigó la detección automática de síntomas respiratorios, específicamente estornudos y estertores asociados a la Bronquitis Infecciosa, utilizando el análisis acústico para la detección temprana de patologías. Los resultados indican que los sistemas de imagen tienen un buen rendimiento en la detección de animales y que el aumento de los niveles de ruido nocturno es un prometedor indicador precoz de enfermedad. En esencia, la investigación presenta avances en tecnologías no invasivas que buscan mejorar la competitividad de la producción avícola y, a la vez, garantizar la transparencia del bienestar animal.
Análisis de imagen y sonido para revolucionar el bienestar avícola
Garantizar a los consumidores que la cría de aves de corral respeta el bienestar animal es fundamental para el avicultor, pero la sociedad civil exige una mayor transparencia en las prácticas avícolas. Satisfacer estas expectativas debe ir de la mano con la competitividad de la producción de carne de ave, un mercado globalizado y altamente competitivo. Las nuevas tecnologías están ofreciendo una oportunidad para evaluar la noción de salud y bienestar animal mediante mediciones continuas y en tiempo real, sin perturbar el entorno vital de los animales.
El análisis de imágenes y sonido permite realizar análisis más finos y frecuentes que los realizados por humanos. Estas herramientas facilitan una mejor supervisión y una mayor capacidad de respuesta a los problemas de salud o a los cambios de comportamiento mediante el análisis predictivo. El artículo «Image and sound analysis for poultry health and welfare indicators» realizado dentro del proyecto EBroilerTrack, liderado por ITAVI, ha generado pruebas de concepto prometedoras tanto en el ámbito de la imagen como en el de la acústica, específicamente en condiciones controladas de cría de pollos de engorde.
«La ventaja de estas herramientas es que permiten recoger datos de forma más regular, sin estresar a los animales, de forma más objetiva y con un menor consumo de tiempo que los métodos tradicionalmente utilizados por un observador humano.»
La exigencia de transparencia en la cría de aves
La creciente conciencia pública sobre la forma en que se crían los animales está impulsando a la industria avícola a introducir formas de informar sobre el bienestar y la salud de las aves. Tradicionalmente, la evaluación del bienestar se ha basado en protocolos de medición que requieren la observación ocasional de los animales por personal capacitado.
Las nuevas tecnologías ofrecen una ventaja significativa: permiten la recogida de datos de forma más regular, objetiva y precisa (a escala individual), además de requerir menos tiempo que los métodos tradicionales. El uso de análisis de imagen o sonido haría posible identificar un problema de salud o bienestar en una fase más temprana, permitiendo una acción correctiva más rápida. Esto podría limitar la propagación de patologías a todo el lote y reducir los costos directos e indirectos asociados, como la limitación del uso de antibióticos o la reducción de la mortalidad.
Según estudios previos, la mayoría de los trabajos relacionados con la agricultura de precisión en la avicultura (42% de 264 publicaciones) utilizan el análisis de imágenes para medir el bienestar. El uso de micrófonos es menos común (14%). Sin embargo, el sonido es crucial, ya que ciertas vocalizaciones pueden reflejar el estado de bienestar (por ejemplo, angustia o comodidad). Además, las aves pueden emitir otros tipos de sonidos, como estertores y estornudos, que reflejan directamente su estado de salud, aunque estos síntomas respiratorios solo son audibles para el oído humano cuando la enfermedad está ya muy avanzada.
«El uso de análisis de imagen o sonido haría posible identificar un problema de salud o bienestar en una fase más temprana para limitar la propagación de la patología a todo el lote de aves y así reducir los costos directos e indirectos asociados.»
Vigilancia individualizada: la visión por computadora en acción
El principal objetivo en el campo de la imagen dentro del proyecto EBroilerTrack fue desarrollar un nuevo sistema de seguimiento basado en inteligencia artificial (IA) que permitiera el seguimiento individual de pollos de engorde en condiciones comerciales.
Principios del seguimiento y detección
El método de seguimiento se compone de dos partes principales. La primera es la detección individual de cada pollo dentro del campo de la cámara, para lo cual se utiliza una red neuronal convolucional (CNN). Este modelo se entrenó con una base de datos de casi 1.000 imágenes, que contenían más de 10.000 pollos. Un modelo basado en aprendizaje es menos sensible a las variaciones de luz y contraste y separa a los pollos abarrotados más fácilmente que un método de visión artificial tradicional.
La segunda parte es el seguimiento (tracking), donde se asigna un identificador único a cada animal. Basándose en las posiciones pasadas, el algoritmo predice la posición del animal en la siguiente imagen y le asigna el identificador del pollo cuya posición estimada está más cerca.
Este sistema genera una lista de indicadores individuales cruciales para la salud y el bienestar:
- Distancia recorrida y velocidad de desplazamiento.
- Duración del período de actividad y tiempo de quietud.
- Tiempo pasado en áreas de interés (zonas de alimentación o bebida, definidas por círculos alrededor de los comederos o rectángulos alrededor de las líneas de pipetas).
- Área superficial del pollo vista desde arriba y área disponible por animal (células de Voronoi).
Desafíos y rendimiento de la detección
Las pruebas de rendimiento se llevaron a cabo utilizando grabaciones en granjas comerciales de pollos ROSS 308, variando la altura de las cámaras (2,5 m, 3,7 m y 5 m). La sensibilidad (VP/(VP+FN)) mide la proporción de pollos correctamente detectados.
Los resultados mostraron que la sensibilidad disminuyó con el aumento de la altura de la cámara, pero aumentó con la edad de los pollos. Por ejemplo, con una cámara a 2,5 m, la sensibilidad pasó del 96,9% a los D12 al 100% a los D39. En cambio, con una cámara a 5 m, la sensibilidad varió del 75,9% a los D12 al 99,5% a los D39.
La razón de esta variación se debe a que la red neuronal convolucional es sensible a la superficie del animal en la imagen (número de píxeles). Un pollo de 12 días filmado a 5 metros tenía un área superficial mucho menor (alrededor de 2.800 píxeles) que un pollo de 39 días a 2,5 metros (17.360 píxeles). Se identificó un umbral crítico: parece haber un límite de entre 3.500 y 4.000 píxeles por animal, por debajo del cual la tasa de detección cae drásticamente.
En cuanto a la densidad de los animales, los resultados experimentales a D29 con densidades de 10 y 20 pollos/m² mostraron una ligera diferencia en la sensibilidad (99,2% para baja densidad vs. 98,1% para alta densidad), lo que sugiere que la densidad no obstaculiza la detección cuando los animales están distribuidos uniformemente. Sin embargo, la tasa de falsos descubrimientos (FDR) fue mayor en la baja densidad (6,6%) que en la alta densidad (4,8%), ya que las zonas vacías, donde aparecen los falsos positivos, son más numerosas.
Rendimiento del seguimiento individual
La calidad del seguimiento depende de la capacidad de detección y de la actividad de los animales. A los 39 días de edad (en reposo), casi no hubo errores de identificación (0,03 errores por animal por minuto). A los 26 días (con mayor actividad), se identificó menos de un error por animal por minuto (0,67), equivalente a un error cada 1,5 minutos. Los errores se concentran principalmente en áreas de muy alta densidad, como las zonas de descanso cercanas a las paredes. Aunque los resultados de este prototipo son prometedores, la calidad del seguimiento podría mejorarse enriqueciendo la base de datos de imágenes en estas áreas específicas de alta densidad.
El oído biónico: detección temprana de bronquitis infecciosa
El componente acústico del proyecto EBroilerTrack se centró en el caso específico de la Bronquitis Infecciosa (BI), un coronavirus que causa problemas respiratorios en las aves. Los ensayos se llevaron a cabo en condiciones experimentales, comparando una sala de control (T) con una sala inoculada con BI (BI).
«Se detectó una diferencia media de 3 dB por la noche en la sala de Bronquitis Infecciosa (BI) en comparación con la sala de control durante los 5 días posteriores a la inoculación.»
Monitoreo del nivel de ruido como indicador precoz
Se detectó una diferencia promedio de 3 dB por la noche en la sala BI en comparación con la sala de control durante los 5 días posteriores a la inoculación. Este resultado es significativo, ya que refleja una intensidad de ruido el doble de alta en la sala de prueba. Los síntomas clínicos de BI (visibles y audibles) aparecieron entre D+3 y D+4. Sin embargo, el estudio de los niveles sonoros mostró un claro aumento de la intensidad en la sala BI a partir del D+2. Una diferencia de 2 dB o más se considera significativa, lo que corresponde a un aumento del 50% en la intensidad sonora. El nivel de ruido nocturno, por lo tanto, parece ser un indicador interesante para la detección temprana de una patología respiratoria.
Caracterización acústica de los síntomas
Para desarrollar un algoritmo de detección automática, se caracterizaron acústicamente los estornudos y los estertores (rales). Se etiquetó una base de datos de 400 señales sonoras por parte de 5 expertos (veterinarios y zootecnistas).
El estornudo se describió acústicamente como un evento corto, de unos 0,25 segundos, con su energía distribuida en una banda de frecuencia de 200 Hz a 5 kHz. En cambio, el estértor (rale) es un evento más débil y largo, con una duración promedio de 1,09 segundos, cuya energía se encuentra entre 100 kHz y 1 kHz, y que puede confundirse con el ruido de fondo.
Los estornudos se caracterizaron por parámetros acústicos como la amplitud máxima, la energía y el valor RMS del señal (significativamente más altos que para los estertores). Los estertores se caracterizaron por una mayor duración y dispersión temporal.
«Para la clase Estornudo, el modelo de red neuronal implementado mostró una sensibilidad del 95% en la detección automática de síntomas respiratorios.
Rendimiento del modelo de detección automática
Se utilizó un modelo de red neuronal (Perceptrón Multicapa, MLP) entrenado con coeficientes cepstrales de frecuencia Mel (una escala que imita la percepción humana del sonido) para predecir cuatro clases: Estornudo, Estértor, Pio y Otros.
El modelo implementado mostró una precisión del 82% para los datos de prueba. Los resultados más alentadores se obtuvieron para la detección automática de estornudos, con una sensibilidad del 95% y una especificidad del 80%. La clase de estértor mostró una sensibilidad del 65% y una especificidad del 98%.
Estos resultados son bastante prometedores, especialmente para los estornudos. Sin embargo, la base de datos utilizada era relativamente pequeña, especialmente para las clases de estertores, pío y otros. Futuras etapas incluyen poblar la base de datos con más señales etiquetadas para mejorar el rendimiento y la robustez del modelo.
Conclusión y perspectivas
El estudio EBroilerTrack ha demostrado que la calidad de la detección por imagen depende de varios parámetros, como la altura de la cámara, la edad y el tamaño del animal, la densidad y la actividad. Los algoritmos desarrollados para el seguimiento individual en granjas comerciales tienen un rendimiento muy alto (> 99% de los animales detectados a partir del día 26 con una cámara a 2,5 m).
En el ámbito acústico, el nivel de ruido nocturno se revela como un indicador prometedor para la detección temprana de patologías como la Bronquitis Infecciosa, incluso antes de que los síntomas sean claramente audibles por los cuidadores.
El siguiente paso crucial en ambos campos es determinar umbrales de alerta para la detección temprana de trastornos de salud y bienestar. Además, se está trabajando para predecir la expresión de comportamientos específicos, como la exploración y el acicalamiento, utilizando los datos de actividad generados por el seguimiento. Estos resultados preliminares en condiciones experimentales son alentadores para futuros ensayos que confirmen la sistematicidad de los hallazgos, como la diferencia de 3 decibelios detectada.
Fuente:
-. Image and sound analysis for poultry health and welfare indicators. Pauline Creach, Brunet Henry, Concordet Didier, Pajusco Nicolas, Riou Mickaël, et al.. Innovations Agronomiques, 2024, 94, pp.256-270. ⟨10.17180/ciag-2024-Vol94-art19-GB⟩. ⟨hal-04799208⟩. Correspondence : creach@itavi.asso.fr
Para saber más:
-. «Vocalization Patterns in Laying Hens – An Analysis of Stress-Induced Audio Responses«. Neethirajan, Suresh. (2023). 10.1101/2023.12.26.573338.
-. «Acoustic precision livestock technologies applied in intensive production of Broiler Chickens for measuring productivity and animal welfare«
-. Usos prácticos de la inteligencia artificial en avicultura
-. Bioacústica aplicada en avicultura

