viernes, 9 de marzo de 2018

Profundizando en la complejidad del desafío del etiquetado de datos

Una mirada a los paralelos entre la adquisición del conocimiento humano y de máquina.

Por Cynthia Kaschub


La industria del cine caracteriza con frecuencia un futuro en el que vivimos con agentes móviles autónomos (AMA) incrustados que perciben, toman decisiones y se comportan como humanos a la perfección. El grado y el momento para que esta "perfección" pueda convertirse en realidad depende en gran medida de las empresas, en todas las industrias, superando un reto de datos clave relacionado con el empleo de inteligencia artificial: cómo obtener datos suficientes y darles sentido para desarrollar modelos que potencien los agentes. La adquisición de datos es el primer paso; dar sentido a esos datos significa encontrar patrones en los datos, asignar un significado estándar a ese patrón y usarlo para obtener ideas y desarrollar modelos. Este es el núcleo de los datos de etiquetado. En todas las industrias y empresas, este es un desafío fundamental común: puede ver los síntomas a través de las inversiones. Por ejemplo, Intel con Intel Saffron, Nervana, Altera, Movidius y Mobileye; Google con DeepMind Technologies, MoodStock, Api.ai y Hailie labs; Apple con Lattice Data, RealFace y Sensomotoric Technologies, por nombrar algunos. En este post, me gustaría demostrar la complejidad del desafío del etiquetado de datos a través del marco del desarrollo de AMA.
 

¿Qué es un agente móvil autónomo?

Un agente móvil autónomo es un robot que puede tener múltiples realizaciones físicas o instancias, como un dron, automóvil, bote, etc. La realización es simplemente la forma física que determinará el rango de funciones que se ejecutarán por los modelos de inteligencia artificial desplegados. en eso. Los modelos se desarrollan, entrenan y evalúan en un centro de datos y se implementan en el borde o ubicación remota con un subconjunto de procesamiento necesario para ejecutar los modelos y enviar información adicional al centro de datos. Un ejemplo de un AMA podría ser un automóvil sin conductor que tenga inteligencia incorporada para transportarlo de manera segura de un lugar a otro.
 

¿Qué se requiere para crear un Agente Móvil Autónomo?

Para crear una AMA, debe capacitar a la AMA para que desarrolle la capacidad de percibir, tomar decisiones y comportarse de manera coherente con el entorno en el que necesita navegar en el futuro. La adquisición de los datos y el desarrollo de la capacidad de tomar decisiones sobre esa información para un AMA es similar a la adquisición de conocimiento que ocurre en humanos. Cuando era bebé, no tenía lenguaje ni medios para comunicarse, pero tenía sentidos básicos (visuales, auditivos, hápticos o táctiles, etc.) que utilizó para adquirir datos y comenzar a darle sentido a su entorno. Probablemente haya tenido cuidadores que estaban tratando activamente de enseñarle qué cosas hay dentro de su entorno ("Aquí hay una manzana y es roja" o "Cuando se lanza una pelota hacia usted, recójala"). Esto continúa hasta que tenga suficiente información para comenzar a extrapolar instancias de aprendizaje específicas a otros dominios. Esto es adquisición de conocimiento. A veces sus extrapolaciones son correctas (un carro rojo se percibe como rojo) y otras veces no (un plátano se percibe como una manzana), pero se corrige en repetidas ocasiones, lo que mejora su comprensión del entorno. Esta retroalimentación lo ayuda a aprender cosas nuevas y comprender las condiciones en las que sus extrapolaciones se pueden aplicar correcta o incorrectamente.
 
Cuando eres mayor, comienzas a rechazar los comentarios o las correcciones de los cuidadores en los años más jóvenes porque has adquirido un nuevo conocimiento de cómo funcionan las cosas. Son las creencias o los modelos los que impulsan las hipótesis, lo que le ayuda a determinar qué comportamientos o acciones debe tomar. Estos modelos de comportamiento se modifican a partir de mecanismos de retroalimentación, ya sea a través de refuerzo positivo (aumenta el comportamiento mediante retroalimentación positiva) o refuerzo negativo (disminuye el comportamiento por retroalimentación negativa), lo que resulta en un comportamiento similar en el primer caso o en un comportamiento decreciente en el segundo caso. Afinando sus modelos internos se obtienen nuevos aprendizajes que se pueden aplicar en una diversidad de escenarios.
 
Ahora que hemos revisado la adquisición de conocimiento en humanos, podemos mostrar pasos paralelos para el aprendizaje de AMA. Comencemos con la suposición de que un AMA es simplemente un factor de forma tonto que debe ser capaz de dar sentido a su entorno. Para hacer esto, necesitamos agregar mecanismos para adquirir datos sobre el medio ambiente, por ejemplo, a través de sensores como radar, LiDAR (detección de luz y rango) , cámaras y GPS. Los datos adquiridos son insignificantes e inútiles a menos que la AMA tenga una forma de identificar los elementos dentro de ella. En aprendizaje automático, llamamos a este objeto detección, reconocimiento y localización. La detección de objetos equivale a detectar la presencia de algo que aún no se ha identificado, el reconocimiento hace coincidir ese elemento con un concepto existente en la memoria, y la localización de objetos es saber dónde está esa cosa en relación con su ubicación actual. Para desarrollar esta capacidad, necesita una gran cantidad de datos del sensor y necesita saber qué contienen los datos.
 
Para determinar qué hay en los datos, se requiere un proceso que requiere mucho tiempo para identificar y etiquetar ítems manualmente, cuadro por cuadro, en cada tipo de flujo de sensor. Por ejemplo, una etiquetadora vería una transmisión de video, cuadro por cuadro, y dibujaría cuadros alrededor de los elementos que coinciden con la identidad de las etiquetas solicitadas. Cuando una etiquetadora ve una señal de alto en un marco, colocan un cuadro delimitador a su alrededor. Esta información etiquetada, llamada "verdad del suelo", se usa para desarrollar modelos. Si tiene una verdad superficial de baja calidad, tendrá modelos que no predicen la realidad tal como se produce, lo que significa que su AMA obtendrá información incorrecta y, a su vez, se comportará de manera inconsistente con el contexto en el que se ha desarrollado. diseñado para comportarse. Los tipos específicos de modelos de inteligencia artificial que está desarrollando determinarán cuántos datos de verdad sobre el terreno necesitará. Los modelos están diseñados para predecir con precisión elementos o eventos en flujos de datos, y esto requiere probar su capacidad predictiva frente a entidades conocidas en los datos de verdad del terreno. Para dibujar el paralelo a los humanos, su hijo señala el bocadillo en su plato y dice "plátano", pero en realidad es una manzana. En este ejemplo, el niño había detectado correctamente un bocadillo, pero lo ha identificado incorrectamente como un plátano (la verdad del suelo era la manzana). En muchos casos de encontrar una manzana, aprenderán a identificarla como una manzana. Veamos ahora cómo se construyen y mejoran los modelos, y cómo un modelo puede identificar con precisión un objeto.
 
Como mencionamos anteriormente, el tipo de modelo que se está desarrollando determina qué objetos y eventos (etiquetas) deben estar en los datos de verdad del terreno. Por ejemplo, para construir un modelo de vehículo autónomo que detecte con precisión las señales de pare, un ingeniero de aprendizaje de máquinas puede necesitar 500 instancias de señales de alto, 500 instancias de otras señales de tráfico y 500 instancias en las que no hay una señal de alto. Para obtener esa cantidad de datos de verdad sobre el terreno, es posible que necesite adquirir 100 TB de datos porque necesita etiquetar más datos para capturar el número de eventos de interés.
 
Una vez que se ha completado el etiquetado manual de los objetos, estos eventos se combinan para mejorar la precisión en una capacidad llamada "fusión del sensor". Por ejemplo, los datos de la cámara etiquetados se pueden fusionar con datos LiDAR para aumentar la precisión de detección de un objeto dado modelo. Esto es similar a cómo los niños daltónicos pueden usar muchos sentidos (p. Ej., Hápticos, visuales y auditivos) para procesar las variaciones, formas y nombres verbales de una manzana roja. Después de que haya suficientes datos de verdad del terreno para que el modelo aprenda (nuevamente, esto está determinado por el tipo de modelo), entonces puede comenzar a inferir en nuevos datos, desarrollando una capacidad llamada "etiquetado automático".
 
El etiquetado automático ejecuta modelos de detección de objetos desarrollados previamente en nuevos datos y facilita el desarrollo de otros modelos al proporcionar datos básicos sobre los datos antes que el proceso de etiquetado manual descrito anteriormente. Existen diferentes tipos de modelos, basados ​​en clústeres, redes neuronales, árboles de decisión, etc. Es la combinación de muchos modelos, dentro de una jerarquía, lo que crea una política de controladores o reglas para el comportamiento. Una vez que tenemos modelos, su eficiencia y precisión deben evaluarse en una serie de entornos simulados donde podemos desafiar el comportamiento del automóvil en escenarios aleatorios recién descubiertos. La solidez de un modelo se evalúa por su rendimiento (p. Ej., La eficiencia en el cálculo de los resultados) y la precisión (por ejemplo, la proporción de resultados correctos) dentro del contexto en el que se diseñó. Por ejemplo, en algunos escenarios, es posible que desee un rendimiento rápido mientras está de acuerdo con el 80% de precisión, pero en otro escenario, la precisión debe ser del 99% y, por lo tanto, está dispuesto a aceptar un rendimiento más lento. Solo después de una evaluación y mejora rigurosa del modelo, se puede implementar un modelo en la AMA, donde podrá percibir, pensar y comportarse de manera similar a los humanos.
 

¿Cuál es el futuro de ver, pensar y percibir AMA?

El proceso de ver, pensar y comportarse para un AMA no es una tarea simple, pero es un proceso que se puede lograr con el tiempo. En los próximos años, es probable que existan formas adicionales para que un automóvil aprenda una vez que se hayan establecido las infraestructuras para la comunicación de automóvil a automóvil y de automóvil a infraestructura. Lo que hemos discutido hasta ahora se ha centrado en un solo dominio: conducir. Es decir, cómo navegar un rango prescrito de comportamientos dentro de un tipo específico de dominio. Algunas preguntas para que considere mientras mira hacia un futuro de AMA: ¿qué otros modelos (por ejemplo, experiencias, comportamientos, entornos, etc.) deberían desarrollarse para que una AMA se integre perfectamente en nuestras vidas? ¿Cuáles son las limitaciones tecnológicas que existen actualmente en el desarrollo de AMA? ¿Cómo cambia nuestra sociedad a medida que agregamos más dominios de modelos? ¿Hay algunos ámbitos en la vida donde la construcción de modelos es imposible (por ejemplo, las emociones)?
 
Esta publicación es una colaboración entre O'Reilly e Intel Saffron.











No hay comentarios.:

Publicar un comentario