Una mirada a los paralelos entre la adquisición del conocimiento humano y de máquina.
Por
La
industria del cine caracteriza con frecuencia un futuro en el que
vivimos con agentes móviles autónomos (AMA) incrustados que perciben,
toman decisiones y se comportan como humanos a la perfección.
El grado y el momento para que esta "perfección" pueda convertirse en
realidad depende en gran medida de las empresas, en todas las
industrias, superando un reto de datos clave relacionado con el empleo
de inteligencia artificial: cómo obtener datos suficientes y darles sentido para desarrollar modelos que potencien los agentes. La adquisición de datos es el primer paso;
dar sentido a esos datos significa encontrar patrones en los datos,
asignar un significado estándar a ese patrón y usarlo para obtener ideas
y desarrollar modelos. Este es el núcleo de los datos de etiquetado. En todas las industrias y empresas, este es un desafío fundamental común: puede ver los síntomas a través de las inversiones. Por ejemplo, Intel con Intel Saffron, Nervana, Altera, Movidius y Mobileye; Google con DeepMind Technologies, MoodStock, Api.ai y Hailie labs; Apple con Lattice Data, RealFace y Sensomotoric Technologies, por nombrar algunos.
En este post, me gustaría demostrar la complejidad del desafío del
etiquetado de datos a través del marco del desarrollo de AMA.
¿Qué es un agente móvil autónomo?
Un agente móvil autónomo es un robot que puede tener múltiples
realizaciones físicas o instancias, como un dron, automóvil, bote, etc.
La realización es simplemente la forma física que determinará el rango
de funciones que se ejecutarán por los modelos de inteligencia
artificial desplegados. en eso.
Los modelos se desarrollan, entrenan y evalúan en un centro de datos y
se implementan en el borde o ubicación remota con un subconjunto de
procesamiento necesario para ejecutar los modelos y enviar información
adicional al centro de datos.
Un ejemplo de un AMA podría ser un automóvil sin conductor que tenga
inteligencia incorporada para transportarlo de manera segura de un lugar
a otro.
¿Qué se requiere para crear un Agente Móvil Autónomo?
Para crear una AMA, debe capacitar a la AMA para que desarrolle la
capacidad de percibir, tomar decisiones y comportarse de manera
coherente con el entorno en el que necesita navegar en el futuro.
La adquisición de los datos y el desarrollo de la capacidad de tomar
decisiones sobre esa información para un AMA es similar a la adquisición
de conocimiento que ocurre en humanos.
Cuando era bebé, no tenía lenguaje ni medios para comunicarse, pero
tenía sentidos básicos (visuales, auditivos, hápticos o táctiles, etc.)
que utilizó para adquirir datos y comenzar a darle sentido a su entorno.
Probablemente haya tenido cuidadores que estaban tratando activamente
de enseñarle qué cosas hay dentro de su entorno ("Aquí hay una manzana y
es roja" o "Cuando se lanza una pelota hacia usted, recójala").
Esto continúa hasta que tenga suficiente información para comenzar a
extrapolar instancias de aprendizaje específicas a otros dominios. Esto es adquisición de conocimiento.
A veces sus extrapolaciones son correctas (un carro rojo se percibe
como rojo) y otras veces no (un plátano se percibe como una manzana),
pero se corrige en repetidas ocasiones, lo que mejora su comprensión del
entorno.
Esta retroalimentación lo ayuda a aprender cosas nuevas y comprender
las condiciones en las que sus extrapolaciones se pueden aplicar
correcta o incorrectamente.
Cuando eres mayor, comienzas a rechazar los comentarios o las
correcciones de los cuidadores en los años más jóvenes porque has
adquirido un nuevo conocimiento de cómo funcionan las cosas.
Son las creencias o los modelos los que impulsan las hipótesis, lo que
le ayuda a determinar qué comportamientos o acciones debe tomar.
Estos modelos de comportamiento se modifican a partir de mecanismos de
retroalimentación, ya sea a través de refuerzo positivo (aumenta el
comportamiento mediante retroalimentación positiva) o refuerzo negativo
(disminuye el comportamiento por retroalimentación negativa), lo que
resulta en un comportamiento similar en el primer caso o en un
comportamiento decreciente en el segundo caso. Afinando sus modelos internos se obtienen nuevos aprendizajes que se pueden aplicar en una diversidad de escenarios.
Ahora que hemos revisado la adquisición de conocimiento en humanos, podemos mostrar pasos paralelos para el aprendizaje de AMA.
Comencemos con la suposición de que un AMA es simplemente un factor de
forma tonto que debe ser capaz de dar sentido a su entorno.
Para hacer esto, necesitamos agregar mecanismos para adquirir datos
sobre el medio ambiente, por ejemplo, a través de sensores como radar, LiDAR (detección de luz y rango) , cámaras y GPS.
Los datos adquiridos son insignificantes e inútiles a menos que la AMA
tenga una forma de identificar los elementos dentro de ella. En aprendizaje automático, llamamos a este objeto detección, reconocimiento y localización.
La detección de objetos equivale a detectar la presencia de algo que
aún no se ha identificado, el reconocimiento hace coincidir ese elemento
con un concepto existente en la memoria, y la localización de objetos
es saber dónde está esa cosa en relación con su ubicación actual. Para desarrollar esta capacidad, necesita una gran cantidad de datos del sensor y necesita saber qué contienen los datos.
Para determinar qué hay en los datos, se requiere un proceso que
requiere mucho tiempo para identificar y etiquetar ítems manualmente,
cuadro por cuadro, en cada tipo de flujo de sensor.
Por ejemplo, una etiquetadora vería una transmisión de video, cuadro
por cuadro, y dibujaría cuadros alrededor de los elementos que coinciden
con la identidad de las etiquetas solicitadas. Cuando una etiquetadora ve una señal de alto en un marco, colocan un cuadro delimitador a su alrededor. Esta información etiquetada, llamada "verdad del suelo", se usa para desarrollar modelos.
Si tiene una verdad superficial de baja calidad, tendrá modelos que no
predicen la realidad tal como se produce, lo que significa que su AMA
obtendrá información incorrecta y, a su vez, se comportará de manera
inconsistente con el contexto en el que se ha desarrollado. diseñado
para comportarse.
Los tipos específicos de modelos de inteligencia artificial que está
desarrollando determinarán cuántos datos de verdad sobre el terreno
necesitará.
Los modelos están diseñados para predecir con precisión elementos o
eventos en flujos de datos, y esto requiere probar su capacidad
predictiva frente a entidades conocidas en los datos de verdad del
terreno.
Para dibujar el paralelo a los humanos, su hijo señala el bocadillo en
su plato y dice "plátano", pero en realidad es una manzana.
En este ejemplo, el niño había detectado correctamente un bocadillo,
pero lo ha identificado incorrectamente como un plátano (la verdad del
suelo era la manzana). En muchos casos de encontrar una manzana, aprenderán a identificarla como una manzana. Veamos ahora cómo se construyen y mejoran los modelos, y cómo un modelo puede identificar con precisión un objeto.
Como mencionamos anteriormente, el tipo de modelo que se está
desarrollando determina qué objetos y eventos (etiquetas) deben estar en
los datos de verdad del terreno.
Por ejemplo, para construir un modelo de vehículo autónomo que detecte
con precisión las señales de pare, un ingeniero de aprendizaje de
máquinas puede necesitar 500 instancias de señales de alto, 500
instancias de otras señales de tráfico y 500 instancias en las que no
hay una señal de alto.
Para obtener esa cantidad de datos de verdad sobre el terreno, es
posible que necesite adquirir 100 TB de datos porque necesita etiquetar
más datos para capturar el número de eventos de interés.
Una vez que se ha completado el etiquetado manual de los objetos, estos
eventos se combinan para mejorar la precisión en una capacidad llamada
"fusión del sensor". Por ejemplo, los datos de la cámara etiquetados se
pueden fusionar con datos LiDAR para aumentar la precisión de detección
de un objeto dado modelo.
Esto es similar a cómo los niños daltónicos pueden usar muchos sentidos
(p. Ej., Hápticos, visuales y auditivos) para procesar las variaciones,
formas y nombres verbales de una manzana roja.
Después de que haya suficientes datos de verdad del terreno para que el
modelo aprenda (nuevamente, esto está determinado por el tipo de
modelo), entonces puede comenzar a inferir en nuevos datos,
desarrollando una capacidad llamada "etiquetado automático".
El etiquetado automático ejecuta modelos de detección de objetos
desarrollados previamente en nuevos datos y facilita el desarrollo de
otros modelos al proporcionar datos básicos sobre los datos antes que el
proceso de etiquetado manual descrito anteriormente.
Existen diferentes tipos de modelos, basados en clústeres, redes
neuronales, árboles de decisión, etc. Es la combinación de muchos
modelos, dentro de una jerarquía, lo que crea una política de
controladores o reglas para el comportamiento.
Una vez que tenemos modelos, su eficiencia y precisión deben evaluarse
en una serie de entornos simulados donde podemos desafiar el
comportamiento del automóvil en escenarios aleatorios recién
descubiertos.
La solidez de un modelo se evalúa por su rendimiento (p. Ej., La
eficiencia en el cálculo de los resultados) y la precisión (por ejemplo,
la proporción de resultados correctos) dentro del contexto en el que se
diseñó.
Por ejemplo, en algunos escenarios, es posible que desee un rendimiento
rápido mientras está de acuerdo con el 80% de precisión, pero en otro
escenario, la precisión debe ser del 99% y, por lo tanto, está dispuesto
a aceptar un rendimiento más lento.
Solo después de una evaluación y mejora rigurosa del modelo, se puede
implementar un modelo en la AMA, donde podrá percibir, pensar y
comportarse de manera similar a los humanos.
¿Cuál es el futuro de ver, pensar y percibir AMA?
El proceso de ver, pensar y comportarse para un AMA no es una tarea
simple, pero es un proceso que se puede lograr con el tiempo.
En los próximos años, es probable que existan formas adicionales para
que un automóvil aprenda una vez que se hayan establecido las
infraestructuras para la comunicación de automóvil a automóvil y de
automóvil a infraestructura. Lo que hemos discutido hasta ahora se ha centrado en un solo dominio: conducir. Es decir, cómo navegar un rango prescrito de comportamientos dentro de un tipo específico de dominio.
Algunas preguntas para que considere mientras mira hacia un futuro de
AMA: ¿qué otros modelos (por ejemplo, experiencias, comportamientos,
entornos, etc.) deberían desarrollarse para que una AMA se integre
perfectamente en nuestras vidas? ¿Cuáles son las limitaciones tecnológicas que existen actualmente en el desarrollo de AMA? ¿Cómo cambia nuestra sociedad a medida que agregamos más dominios de modelos? ¿Hay algunos ámbitos en la vida donde la construcción de modelos es imposible (por ejemplo, las emociones)?
Esta publicación es una colaboración entre O'Reilly e Intel Saffron.
No hay comentarios.:
Publicar un comentario