Investigadores de la Universidad Metropolitana de Osaka desarrollaron entornos virtuales realistas que generan imágenes y etiquetas para entrenar sistemas de inteligencia artificial agrícola.
Redactor: Raúl Méndez C.
Editor: Eduardo Schmitz
La automatización de la cosecha de tomate avanza hacia una nueva etapa: entrenar robots agrícolas en granjas virtuales antes de llevarlos al campo o al invernadero. Investigadores de la Universidad Metropolitana de Osaka desarrollaron un método para crear entornos digitales realistas de cultivos de tomate, capaces de generar datos automáticamente para sistemas de inteligencia artificial agrícola.
El avance apunta a uno de los grandes cuellos de botella de la robótica agrícola: la falta de datos suficientemente variados y etiquetados para enseñar a las máquinas a reconocer frutos, estimar madurez y actuar en condiciones reales. La cosecha sigue siendo una de las tareas más intensivas en mano de obra, especialmente en cultivos donde cada fruto debe identificarse y manipularse con precisión.
Los robots agrícolas actuales utilizan sistemas de detección de objetos para localizar tomates y modelos de inteligencia artificial para decidir si están maduros. Sin embargo, entrenar esos sistemas exige grandes cantidades de imágenes tomadas en granjas reales. Cada tomate debe marcarse manualmente con recuadros de identificación y clasificarse por estado de madurez, un proceso lento, costoso y difícil de repetir en distintas estaciones, fincas y condiciones de luz.
Una granja digital construida con datos reales
El equipo dirigido por Takuya Fujinaga, de la Graduate School of Engineering de la Universidad Metropolitana de Osaka, creó un entorno agrícola virtual a partir de imágenes reales obtenidas con cámaras instaladas en robots de cosecha de tomate. La idea fue reconstruir digitalmente el escenario donde trabaja el robot, pero con capacidad para generar nuevas imágenes y etiquetas de entrenamiento sin tener que marcar cada fruto de forma manual.
Para lograrlo, los investigadores utilizaron métodos avanzados de reconstrucción tridimensional, el motor gráfico Unreal Engine 5 y una técnica emergente conocida como 3D Gaussian Splatting. Esta combinación permitió reproducir iluminación, texturas, geometría, hojas, tallos, sombras y frutos parcialmente ocultos, condiciones que suelen dificultar el trabajo de los sistemas de visión artificial.
El resultado fue una granja virtual más cercana a las situaciones reales que enfrenta un robot. En una plantación de tomate, los frutos no aparecen aislados ni siempre visibles. Pueden estar detrás de hojas, mezclados con tallos, afectados por cambios de luz o ubicados en posiciones que complican su detección. Ese tipo de variabilidad es justamente lo que debe aprender una inteligencia artificial si quiere funcionar fuera del laboratorio.
Etiquetas automáticas para entrenar inteligencia artificial
La principal ventaja del sistema es que genera automáticamente las etiquetas necesarias para entrenar modelos de detección. A partir de la información de posición dentro del entorno virtual, el sistema indica dónde aparece cada tomate en la imagen y cuál es su grado de madurez.
El marco también exporta anotaciones en formato YOLO, un estándar ampliamente utilizado para entrenar modelos de detección de objetos. Esto facilita que las imágenes sintéticas producidas en la granja virtual puedan incorporarse directamente a procesos de entrenamiento de inteligencia artificial agrícola.
La causa y el resultado son claros: al reconstruir una granja virtual realista, el equipo puede producir muchas imágenes con etiquetas automáticas; al reducir la necesidad de etiquetado manual, se acelera el entrenamiento de modelos; y al entrenar con escenas más variadas, los robots pueden mejorar su capacidad para detectar tomates en imágenes reales.
Por qué la cosecha sigue siendo difícil para los robots
La cosecha robotizada exige más que reconocer un fruto rojo en una imagen. El sistema debe distinguir tomates maduros de inmaduros, identificar frutos parcialmente tapados, calcular posición y profundidad, evitar dañar ramas y actuar con rapidez suficiente para que el proceso tenga sentido productivo.
En cultivos hortícolas, la variación natural complica la automatización. Dos plantas no crecen exactamente igual. La luz cambia durante el día. Las hojas proyectan sombras. Los frutos pueden agruparse o quedar escondidos. Un robot necesita entrenarse con esa diversidad si quiere operar en condiciones reales.
Este reto ya aparece en otros cultivos donde la robótica intenta entrar al campo. En el caso de los robots recolectores, la forma en que hojas y frutos se distribuyen en la planta puede dificultar la visión y la manipulación. En tomate, el problema es similar: la inteligencia artificial debe aprender a interpretar escenas vegetales complejas, no imágenes perfectas.
La simulación como atajo para el campo
Entrenar inteligencia artificial solo con datos reales tiene una limitación práctica: cada finca, variedad, estación y sistema de manejo genera imágenes distintas. Recolectar datos suficientes para todas esas condiciones puede requerir mucho tiempo y trabajo humano. La simulación permite ampliar el volumen de datos sin depender por completo de campañas de captura en campo.
El enfoque de la Universidad Metropolitana de Osaka no reemplaza los datos reales, pero los multiplica. Al partir de imágenes captadas por robots agrícolas y reconstruir ambientes virtuales, el sistema conserva rasgos del mundo real y, al mismo tiempo, permite generar nuevas combinaciones de iluminación, formas, posiciones y niveles de madurez.
Esta lógica se alinea con el avance de la agricultura de precisión con inteligencia artificial, donde cámaras, sensores, modelos computacionales y robots empiezan a integrarse para tomar decisiones más rápidas y localizadas.
Tomates, visión artificial y madurez del fruto
El trabajo no se limita a detectar la presencia de un tomate. También busca aportar información sobre su madurez, un dato clave para la cosecha selectiva. En la práctica, un robot necesita decidir qué frutos cosechar y cuáles dejar en la planta para una recolección posterior.
La madurez se expresa en color, textura, forma y contexto visual. En una imagen real, esos rasgos pueden cambiar por la iluminación, la sombra o la posición del fruto. Por eso, entrenar con escenas sintéticas realistas puede ayudar a que los modelos no dependan de condiciones demasiado limpias o artificiales.
La visión artificial ya se utiliza en distintos desarrollos hortícolas, como sistemas capaces de identificar enfermedades o estimar cosecha en invernadero. En esa línea, un robot con cámara para tomate en invernadero muestra cómo la captura de imágenes puede convertirse en una herramienta para diagnóstico, conteo y toma de decisiones.
Un método aplicable a otros cultivos
Aunque el estudio se centró en tomate, los investigadores consideran que factores como la iluminación, la forma del fruto y el tamaño del conjunto de datos también son importantes para la cosecha de otros productos agrícolas. Takuya Fujinaga destacó que comprender cómo esas variables afectan la precisión de la inteligencia artificial será clave para mejorar los modelos en el futuro.
La metodología podría adaptarse a cultivos donde la detección visual y la madurez sean decisivas. Frutas, hortalizas y otros productos cosechados de forma selectiva enfrentan problemas parecidos: frutos ocultos, variación de color, cambios de luz, estructuras vegetales complejas y necesidad de manipulación cuidadosa.
La robótica agrícola ya no se limita a máquinas grandes que recorren lotes extensivos. También avanza en cultivos intensivos, invernaderos y sistemas de producción donde la mano de obra representa una parte importante del costo. En ese contexto, los robots en agricultura de precisión necesitan datos de calidad para operar con seguridad y eficiencia.
Una herramienta para reducir trabajo manual
La creación de datos sintéticos puede reducir una de las tareas más repetitivas del desarrollo de inteligencia artificial: el etiquetado manual de imágenes. En lugar de dibujar recuadros sobre miles de tomates y clasificar uno por uno su estado de madurez, el sistema virtual genera esas anotaciones automáticamente.
Esto no elimina la necesidad de validar los modelos con datos reales, pero sí puede acelerar el desarrollo inicial y facilitar comparaciones entre distintos escenarios. Los investigadores pudieron usar los conjuntos de datos sintéticos para entrenar modelos de inteligencia artificial y comprobar que detectaban tomates en imágenes reales.
Para la agricultura, el valor del avance está en acercar la robótica a condiciones prácticas. Si entrenar modelos se vuelve más rápido, menos costoso y más adaptable, los robots cosechadores pueden mejorar su desempeño y acercarse a una adopción más amplia.
La próxima etapa de la automatización hortícola
La investigación publicada en Smart Agricultural Technology muestra que la inteligencia artificial agrícola no depende solo de mejores algoritmos. También necesita mejores datos, entornos de entrenamiento y formas de representar la complejidad del cultivo.
La granja virtual de tomate desarrollada en Japón funciona como un campo de entrenamiento digital. Allí, el robot no corta frutos ni se desplaza físicamente entre hileras, pero su sistema de visión aprende a interpretar escenas que imitan el desorden real de una planta productiva.
En cultivos donde la cosecha exige precisión y mucha mano de obra, este tipo de herramienta puede acelerar el camino hacia robots más confiables. La clave estará en combinar simulación, datos reales, validación en campo y diseños mecánicos capaces de manipular frutos sin dañarlos.
Para los productores, el avance todavía pertenece al terreno de la investigación aplicada, pero señala una dirección concreta: la automatización agrícola dependerá cada vez más de entrenar máquinas en mundos digitales antes de ponerlas a trabajar entre plantas reales.
Fuente(s) referenciales
Phys.org: Scientists develop virtual tomato training arena for agricultural robots
