Instagram es el arma secreta de Facebook en la carrera por desarrollar modelos más sofisticados de aprendizaje automático de inteligencia artificial. Y es que la empresa de Menlo Park se vale de las miles de millones de imágenes de la plataforma de fotografías para entrenar a su tecnología, informa el sitio «TechCrunch».
Durante el segundo día de la conferencia para desarrolladores F8, Facebook detalló una investigación de cómo las miles de millones de fotos públicas de Instagram que han sido anotadas por los usuarios con etiquetas fueron utilizados como datos para entrenar a sus modelos de reconocimiento de imágenes.
El estudio se basó en cientos de GPU que funcionan las 24 horas del día para analizar los datos, pero finalmente se les dejaron modelos de aprendizaje profundo que superaron a los puntos de referencia de la industria, que es 85.4 por ciento de exactitud según ImageNet.
Eso quiere decir que si has anexado una etiqueta a una foto que has publicado en Instagram, no significa necesariamente que has creado una categoría aprovechada por Facebook. Y es que el mérito del estudio recae en el desafío que significó clasificar lo que era relevante entre miles de millones de imágenes.
Hablando a gran escala, la prueba más grande de este tipo utilizó 3,5 mil millones de imágenes de Instagram que abarcan 17 mil etiquetas. Facebook no cuenta con los recursos para supervisar de cerca estos datos. Otros caminos que han tomado diferentes empresas fue utilizar imágenes filtradas y analizadas previamente por humanos, pero la red social creó «otros métodos» para emprender su trabajo.
La investigación de «pre entrenamiento» tuvo el objetivo de desarrollar sistemas que encuentren etiquetas relevantes. Esto significó que se tuvo que identificar etiquetas que eran sinónimos y al mismo tiempo, aprender a priorizar los que eran más específicos sobre los generales. Esto condujo al denominado «modelo de predicción de etiqueta a gran escala».
Cabe precisar que el producto en que se centró este modelo fue en el reconocimiento de imágenes de objetos. Facebook no puede utilizar esta información para predecir quién es tu pareja ni para emplear una base de datos para entender que hace a una foto popular. Pero sí identificar alimentos, razas de perros, y más.
El dato
Las implicancias de privacidad en esta investigación son un tema aparte. Si bien Facebook solo utilizó imágenes públicas, pero ¿los usuarios eran conscientes que su información era utilizada para este fin?