Autoría creativa con IA: Investigador Patrick Hebron

MIT Sloan Management Review México

Si alguna vez has jugado con la función Generative Fill de Adobe Photoshop o has trabajado en la plataforma Omniverse de Nvidia, entonces conoces el trabajo que Patrick Hebron ha hecho posible.  Patrick, con doble especialización en filosofía y producción cinematográfica, aborda las actividades creativas con una profunda curiosidad.

Transcript

00:00¿Cómo se traduce el uso de la AI generativa en los campos creativos a las oportunidades para el futuro?

00:07Encontradlo en el episodio de hoy.

00:10Soy Patrick Hebron, autor de Machine Learning for Designers, y estáis escuchando a mí, a mí mismo y a la AI.

00:17Bienvenidos a mí, a mí mismo y a la AI, un podcast sobre inteligencia artificial y negocio.

00:22En cada episodio, os presentamos a alguien innovador con la AI.

00:27Soy Sam Ransbotham, profesor de analítica en el Colegio de Boston.

00:31También soy el editor de guestos de la estrategia de la AI y el negocio en la revisión de la gestión de riesgo de MIT.

00:36Y yo soy Shervin Korubande, compañero senador con BCG y uno de los líderes de nuestro negocio de la AI.

00:43Juntos, MIT, SMR y BCG han estado investigando y publicando sobre la AI desde 2017,

00:49entrevistando a cientos de profesionales y investigando a miles de empresas

00:54sobre lo que demora para construir y desplegar y escalar las capacidades de la AI

00:58y realmente transformar la forma en que las organizaciones operan.

01:02Hola a todos. Hoy, Sam y yo estamos emocionados por hablar con Patrick Hebron.

01:07Es el autor de Machine Learning for Designers

01:10y tiene un papel en NVIDIA Omniverse, Stability AI y Adobe.

01:15Patrick, gracias por tomar el tiempo de hablar con nosotros.

01:18Gracias por tenerme. Es un placer estar aquí.

01:20Tengo que decir, de inmediato, estoy curioso de por qué Machine Learning es diferente para los diseñadores.

01:25¿Qué significa la parte de los cuatro diseñadores?

01:28Cuando escribí el libro, esta no era una intersección que era muy sensible para la mayoría de la gente.

01:33Así que he estado trabajando en esa intersección desde la época de mis maestros

01:38y me di cuenta de la idea de que en el diseño puede haber problemas de configuración realmente desafiantes

01:45y que las máquinas pueden ayudar a jugar un papel en descubrir cómo rellenar muchas diferentes permutaciones

01:52y llegar a un arreglo que pueda ser útil para la gente.

01:55Así que eso fue lo que estaba sucediendo en mi propio trabajo en ese momento.

01:58Y luego, a medida que la tecnología comenzó a avanzar bastante,

02:02me pareció que había que haber algunas grandes diferencias

02:06en cómo pensábamos sobre la producción de software a causa de la AI.

02:10El software convencional siempre es correcto sobre cosas mundanas, como, por ejemplo, 2 plus 2.

02:15Y Machine Learning, por supuesto, te permite hacer cosas mucho más complejas,

02:19como identificar frases y fotos, o un millón de cosas.

02:23Pero no siempre está bien sobre esas cosas.

02:25Hay una imprecisión inherente a eso.

02:27Y este hecho en sí lleva a una gran implicación cuando estás diseñando software,

02:31pensando en cómo el usuario navega por un proceso

02:35y, en particular, lo que sucede cuando alcanzan un final desesperado o un entendimiento incorrecto.

02:39O'Reilly me acercó a escribir ese libro y estuve muy emocionado por abordar este tema

02:44y empezar a ayudar a los diseñadores a pensar en cómo esto transformaría su práctica.

02:49Esa es una aproximación fundamentalmente diferente,

02:51porque nos acostumbramos a que el software es muy determinista,

02:55nos acostumbramos a que los procesos funcionen de la misma manera

02:58cuando los pruebas en el laboratorio,

03:00pero luego funcionan de una manera diferente

03:02cuando introducimos ruido y oscuridad en todo el proceso.

03:06Entonces, ¿cómo las personas se tratan del hecho de que lo que prueban y lo que trabajan

03:11no es necesariamente lo que sucede cuando se introducen en la producción?

03:14Sí, es gracioso porque,

03:16no quiero apreciar a los modelos de aprendizaje de máquinas demasiado a un humano,

03:20pero creo que una cosa que tenemos en común con ellos es este tipo de imprecisión.

03:24Somos capaces de nociones grandes,

03:26pero nunca podemos garantizar que lo que está en la cabeza de alguien

03:30es cohesivo exactamente de la misma manera que lo es en tu cabeza.

03:34Y la mayoría de las personas no son cohesivas con lo que yo pienso.

03:37Sí, lo mismo.

03:39Una cosa es recordar que todavía hay software convencional,

03:44así que tener una especie de plan de apoyo

03:46o revertir a la funcionalidad convencional

03:48cuando un sistema AI más complejo fallece es una mitigación.

03:52Por supuesto, hay un desafío con eso,

03:55que es que probablemente si lo que tu software está haciendo requiere AI en primer lugar,

03:59entonces el fallo puede ser difícil

04:02porque el software convencional no es apto para el trabajo.

04:05Pero tener la máquina presentándole al usuario lo que ha entendido

04:10creo que es muy importante,

04:12para que no vaya y actúe en una disconcepción.

04:16Otro desafío es la disponibilidad de descubrir.

04:18Vemos esto con, por ejemplo, Alexa.

04:20Hay todas estas funciones, pero están escondidas en algún lugar.

04:23Entonces, ¿cómo sabes qué eres o no puedes hacer?

04:26Creo que esto es, en ciertas maneras,

04:29una regresión del software tradicional,

04:31porque los sistemas de menú gigantes han sido el enemigo de mi carrera, creo.

04:35Pero al mismo tiempo, tienen un desafío determinado,

04:38que es que hay un camino obvio para aprender

04:41qué puede hacer el software.

04:43Entonces, vas a encontrar alguna función en particular que necesites en este momento,

04:46la encuentras en este sistema de menú

04:48y probablemente está adjacente a algunas funciones relacionadas,

04:51y esto te expone al menos a ver sus nombres

04:54y tal vez esto te llevará a explorarlo hacia ellos.

04:58No necesariamente tienes eso con, por ejemplo,

05:00la capacidad de hablar a tu computadora y pedir algo.

05:03Es una dimensión interesante.

05:05No había pensado en eso,

05:07pero mientras estabas diciendo eso,

05:09estaba pensando de vuelta en mi propia vida pasada

05:12y había un producto llamado Microsoft Fox Pro,

05:15que era uno de los sistemas de database inicios.

05:18Y yo, en ese momento, estaba súper interesado

05:20en saber cada posible cosa que ese piso de software podría hacer.

05:23Y una de las cosas que hicimos fue abrir el executable

05:27y buscar signos de comandos que estaban ahí,

05:30incluso si no estaban en la documentación.

05:33Pero eso no existe.

05:35El mundo que estás hablando aquí es muy diferente.

05:38No hay un executable para abrir.

05:40A menudo no hay documentación para ir a través.

05:43Entonces, esta evolución rápida de todo al mismo tiempo

05:46parece realmente fascinante.

05:48No había pensado en eso.

05:50Sí, y hay otro tipo de punto débil

05:53que viene con lo que estás diciendo,

05:55que es que el software podría trabajar de vez en cuando

05:58en relación a, digamos, algún tipo particular de cuestión,

06:01y luego, por la milésima vez,

06:03no lo entiende correctamente,

06:05va en una dirección completamente diferente.

06:07Creo que esa es la naturaleza del aprendizaje inductivo.

06:10Nunca tienes una fuerte garantía

06:13de que has visto todas las cosas posibles.

06:16Al aprender de experiencia,

06:18vemos, digamos, dos autos

06:20y ahora tenemos algún sentido de la variedad de tamaños de autos.

06:23Vemos, digamos, un millón de autos

06:25y ahora nos sentimos bastante confiantes

06:27de que tenemos una verdadera comprensión,

06:29un mapeamiento de la variedad de tamaños que un auto podría tener.

06:32Pero realmente nunca tenemos una garantía

06:34de que hemos visto el más grande o el más pequeño auto.

06:37Y este tipo de oscuridad en las fronteras

06:40es un reto, pero al mismo tiempo

06:42nos da todo lo que tenemos con la AI.

06:45Sí, eso es bastante fascinante también.

06:47De nuevo, no había pensado en eso,

06:49en cómo pasamos por ese proceso inductivo.

06:52Patrick, ¿cómo te interesaste en estos tipos de problemas?

06:55¿Puedes contarnos un poco más sobre tu origen?

06:58Mi camino es probablemente un poco inconvencional.

07:01Como estudiante, estudié filosofía,

07:03en particular estética y semiología,

07:06y luego también hice un segundo maestro en producción de películas.

07:10Para mi trabajo de producción de películas,

07:12terminé haciendo un filme narrativo,

07:14así que no estaba tan conectado con este trabajo.

07:16Para mi trabajo de filosofía,

07:18me interesé especialmente

07:20en el filósofo estadounidense Charles Peirce,

07:23un semiólogo que trabaja con la teoría de los signos.

07:26Para ese proyecto, hablé de efectos especiales,

07:29básicamente, como un medio artístico,

07:31pensando en la implicación de un medio

07:33en el que tienes la capacidad de portar

07:35cualquier cosa imaginable, como lo haces en la pintura,

07:38pero con la credibilidad aparente de la fotografía.

07:41Esa combinación es realmente interesante,

07:44poderosa, quizás incluso peligrosa.

07:47En ese momento, estaba imaginando

07:49cómo esto se reuniría

07:51básicamente con un avance en gráficos computadores.

07:53La inteligencia artificial no estaba en mi radar en ese momento,

07:56y también hubo un largo tiempo

07:58desde que llegué a ese tipo de habilidad,

08:00pero esto fue realmente interesante para mí.

08:02Y así, cuando salí de la universidad,

08:04la gente me preguntó,

08:06¿qué tipo de filme me apuntarías

08:08que se acompañe de lo que dices?

08:10Y yo dije, bueno, no sé si haya sido hecho en realidad,

08:13si esta descripción corresponde.

08:15Empecé a intentar hacer esos filmes,

08:17y muy rápidamente, esto me llevó a sentir

08:20que las herramientas que estaban disponibles

08:22para la producción de CG

08:24no estaban realmente diseñadas para las cosas que intentaba hacer.

08:27Y así, como niño,

08:29había hecho un poco de experimentación electrónica

08:31y un poco de programación y tal,

08:33pero no un montón.

08:35Así que fue entonces que empecé a aprender

08:37cómo escribir software

08:39para, básicamente, crear estas herramientas de diseño

08:41para hacer los filmes que intentaba hacer.

08:43Y luego, muy rápidamente,

08:45me di cuenta de que ese era mi interés real,

08:47pensando en cómo las herramientas de diseño,

08:49y en particular, las herramientas de diseño y la inteligencia artificial,

08:51podían funcionar, y eso fue mi interés central.

08:53Y ese interés te ha pagado un poco.

08:56¿Puede que nos cuentes un poco

08:58sobre algunos de los proyectos que has trabajado en el pasado?

09:03Gracias por escuchar a mí, a mí mismo y a la inteligencia artificial.

09:05Nuestro programa fue capaz de continuar,

09:07en gran parte, gracias al apoyo de los escuchadores.

09:09Tus streamings y descargas hacen una gran diferencia.

09:11Si tienes un momento, por favor considera dejarnos

09:13una revisión de un podcast de Apple,

09:15o un rating en Spotify,

09:17y compártelo con otros que crean que es interesante y útil.

09:25Claro.

09:27Poco después de escribir el libro de O'Reilly,

09:29fui acercado a Adobe.

09:31Y, en ese momento,

09:33los vicepresidentes de investigación y diseño

09:35estaban hablando, y estaban

09:37anticipando lo que iba a venir

09:39en los próximos años con la Inteligencia Artificial.

09:41Podían ver que había

09:43muchos lugares en los que la Inteligencia Artificial

09:45podía entrar bajo el anillo de los productos de Adobe

09:47y tener una transformación

09:49de la calidad

09:51de la capacidad

09:53sin necesariamente cambiar la experiencia del usuario

09:55de una manera particularmente significativa.

09:57Un ejemplo de eso podría ser

09:59algo como Content Aware Fill.

10:01Antes de los últimos años,

10:03esa función fue implementada

10:05usando un tipo de algoritmo de extensión de patrón.

10:07Esto funcionaría muy bien

10:09si, por ejemplo,

10:11tratabas de quitar un balón de playa

10:13de sal. Porque, por supuesto,

10:15el sal es un patrón que extiende

10:17perfectamente bien, así que funciona bien.

10:19Pero si, por algún motivo, tratabas de

10:21llenar una región de boca

10:23de una cara humana,

10:25la extensión de los labios, por supuesto,

10:27no te daría lo que quieres.

10:29Entonces, en lugar de usar la pintura neural,

10:31podrías hacerlo mucho mejor,

10:33porque, por supuesto, estás aprendiendo

10:35qué pintar allí desde un gran

10:37ejemplo estatístico sobre cómo estas diferentes

10:39funciones de imagen se relacionan con una a otra,

10:41y así, por supuesto, puedes obtener

10:43una funcionalidad mucho mejor. Pero desde la perspectiva del usuario,

10:45este tool no necesita operar de una manera muy distinta.

10:47Eso es lo que sería fácil

10:49para Adobe para integrarlo a sus productos.

10:51Las cosas que serían más difíciles

10:53son las cosas que estamos empezando a ver ahora,

10:55que no tienen un predecesor

10:57directo, porque las tecnologías anteriores

10:59simplemente no podían

11:01acercarse a ellas.

11:03Oh, claro. Por ejemplo,

11:05poder generar una imagen

11:07de texto, o

11:09hacer algo como

11:11reposar completamente un cuerpo humano.

11:13Tal vez otra área que debería tocar

11:15en respuesta a tu pregunta es

11:17navegación de espacio lenta.

11:19Entonces, dentro del mente de un modelo de aprendizaje

11:21de máquinas, produce

11:23una especie de representación interior

11:25de la variabilidad

11:27en las cosas que se ve y que se aprende.

11:29Entonces, ese espacio

11:31puede ser navegado

11:33en transversal lineal.

11:35En una parte de ese espacio,

11:37podrías tener cosas que parecen

11:39zapatos, y luego, cerca de ahí,

11:41podrías tener cosas que parecen zapatos,

11:43y luego, muy lejos, podrías tener

11:45cosas que parecen, no sé, pájaros.

11:47Entonces, navegando

11:49de una a la otra es un proceso

11:51por el que puedes explorar

11:53y descubrir lo que estás buscando.

11:55Esto podría ser un mecanismo de diseño muy útil,

11:57porque es como, bueno,

11:59eso no está muy bien, pero quiero algo

12:01cerca de eso. Ser capaz de mirarlo

12:03y moverme en ese espacio,

12:05realmente baja la barrera

12:07de exploración y experimentación en el diseño,

12:09donde, tradicionalmente, quizás dibujaste

12:11un zapato, y ahora quieres

12:13probar un zapato de trabajo. Tienes que

12:15completamente redirigir tu entero dibujo,

12:17y es un proceso muy involucrante.

12:19Es una fuente muy poderosa.

12:21Pero, por supuesto, este modo de pensar

12:23en diseñar algo

12:25es sin precedentes,

12:27quizás, y así, pensando en

12:29cómo deberían parecer las interfaces

12:31es un ejercicio de diseño nuevo.

12:33Eso parece interesante también,

12:35porque, si volvemos a tu filo generativo,

12:37sí, es bastante claro que, hey,

12:39solo quiero filar este área, y puedes usar

12:41un nuevo algoritmo para hacerlo

12:43mejor, más fuerte, más rápido,

12:45más rápido, a través de algún ML,

12:47pero no hay una analogía

12:49en la interfaz del usuario para algunas de estas otras herramientas

12:51o algunas de estas otras formas de trabajar.

12:53Así que parece complicado

12:55para un usuario.

12:57Al final, hay un ser humano sentado allí.

12:59¿Cómo les puedes dejar saber que

13:01pueden rotar a una persona,

13:03o que pueden mover algo en el espacio,

13:05o que pueden hacer que un zapato

13:07parezca un zapato de trabajo,

13:09o que lo muevan hacia el espectro de un tiburón?

13:11¿Cómo les puedes dejar saber eso en una interfaz

13:13sin que los envergure?

13:15Sí, es una buena pregunta. Es divertido

13:17porque tengo opiniones sobre esto

13:19que van en dos direcciones completamente opuestas.

13:21En un caso...

13:23Siempre es divertido cuando hay tensión.

13:25Exactamente.

13:27Necesitas la tensión, especialmente en el diseño.

13:29Desde un lado,

13:31como mencionaba un momento antes,

13:33quieres usar la familiaridad

13:35donde la tienes.

13:37Si hay algún truco de algún área relacionada,

13:39entonces, ¿por qué no ayudar a aclamar

13:41al usuario a eso?

13:43En el caso de algo como navegación lenta,

13:45esto podría parecer un mapa.

13:47Estas destinaciones de zapatos

13:49y zapatos de trabajo.

13:51Es como si el sistema existiera en una superficie

13:53y te dirigieras un poco más al oeste

13:55si quieres llegar a la playa.

13:57O, similarmente,

13:59te dirigirías un poco más en esta dirección

14:01si quieres llegar a este tipo de zapatos.

14:03Entonces, creo que esos tipos de cues son muy útiles.

14:05Al mismo tiempo,

14:07creo que tienes que tener cuidado

14:09porque un medio artístico

14:11o un medio de diseño

14:13es algo donde las propiedades del medio

14:15en sí mismo van a tener

14:17un gran impacto en la naturaleza de la salida.

14:19Volviendo a Clement Greenberg,

14:21el teórico de arte,

14:23quien básicamente dijo

14:25que no se debería hacer una escultura

14:27que debería ser una pintura

14:29para truncar eso.

14:31Creo que, al mismo tiempo,

14:33no quieres necesariamente

14:35que la gente haga arte con la AI

14:37en la misma mentalidad

14:39que lo harían con Photoshop antes de la AI.

14:41Creo que quieres

14:43intentar engendrar

14:45una especie de abiertura

14:47para poder hacer

14:49la mayoría del trabajo para ti.

14:51Porque, generalmente,

14:53lo primero que harán

14:55es algo muy cercano

14:57al paradigma anterior,

14:59como las herramientas de edición de películas

15:01que se borran de los editores

15:03de tabletop de Steam.

15:05Al mismo tiempo, la generación de la AI

15:07primero ve muy cercano

15:09a lo que hacían con las herramientas

15:11de la generación anterior

15:13y luego empiezan a explorar hacia afuera.

15:15Para mí, como creador de herramientas,

15:17lo más importante

15:19es que siempre hablamos

15:21de casos de uso,

15:23necesidades de usuario y puntos de daño de usuario

15:25y intentamos desarrollar

15:27trabajos que estén bien investigados

15:29en términos de lo que un usuario intenta hacer.

15:31Pero siempre siento que

15:33si la herramienta se utiliza

15:35exactamente como lo esperábamos,

15:37entonces realmente hemos fallado

15:39catastróficamente.

15:41Creo que las cosas más interesantes

15:43de las herramientas de la generación anterior

15:45son las cosas que están cerca

15:47de lo que deberían ser.

15:49Un ejemplo que me gusta dar con eso

15:51son las personas que construyen cosas

15:53como computadoras de 8 bits en Minecraft.

15:55Es un poco loco desde una perspectiva práctica.

15:57Obviamente, esta es una de las maneras

15:59más ineficientes de poder producir

16:01la simulación de un procesador,

16:03pero al mismo tiempo es tan genial.

16:05Es fascinante.

16:07De hecho, ¿puedes volver y explicar

16:09un poco sobre eso?

16:11Porque hay gente que entiende

16:13lo que es, pero tal vez

16:15explícanos el procesador de 8 bits en Minecraft,

16:17tal vez para las personas que no lo conocen.

16:19Sí, absolutamente.

16:21Minecraft es un juego

16:23con una visión de fidelidad baja,

16:25creo que podríamos decir que es un juego

16:27de mundo abierto.

16:29En él, el usuario puede poner estos bloques

16:31o remover los bloques,

16:33y la mayoría de ellos son estáticos,

16:35para representar el concreto y cosas así.

16:37Pero también puede haber bloques de agua

16:39y sistemas dinámicos.

16:41Esto significa que

16:43puedes mover bloques alrededor del espacio.

16:45Como resultado,

16:47puedes simular el flujo de datos.

16:49Y como resultado,

16:51es posible crear

16:53una especie de simulación

16:55de cómo los electrones se moverían

16:57a través de un chip.

16:59Por lo tanto, puedes crear

17:01una especie de emulación

17:03de un procesador de computadores.

17:05Estos tipos de proyectos

17:07son, para mí, los mejores

17:09de una herramienta abierta.

17:11Mucho de lo que se está enfrentando aquí es

17:13que voy a definirlo

17:15como una explotación

17:17donde quieres hacer fácil

17:19estas mejoras incrementales

17:21porque eso es el rellenar

17:23el balón de la playa y el sal.

17:25Por otro lado, quieres

17:27también apoyar la capacidad

17:29de hacer algo loco.

17:31Y parece que la mayoría de lo que has hablado

17:33está en el espacio del diseño visual.

17:35¿Esta tensión se realiza en otros lugares?

17:37¿Qué otras maneras

17:39podemos...

17:41Empezamos con el aprendizaje de máquinas

17:43para clasificar el spam, sí o no,

17:451-0, sí o no,

17:47¿es esto spam, es esto fraude?

17:49Y ahora estamos hablando de llenar

17:51la boca y la cara.

17:53¿A dónde va este diseño?

17:55¿Qué más podemos usar estos

17:57herramientas para diseñar?

17:59Hemos visto durante los últimos dos o más años

18:01esta explosión de aplicabilidad

18:03en nuestro sistema educativo.

18:05Hemos venido a ver un contraste

18:07entre los artes y las ciencias,

18:09o entre diseño y ingeniería,

18:11o arte y ciencia, o lo que quieras.

18:13Voy a usar un ejemplo de arte, porque creo que es más fácil

18:15de hablar aquí, pero si estás intentando dibujar

18:17una portada de una cara humana,

18:19creo que la mayoría de los artistas dirían

18:21que sería un error intentar dibujar

18:23la nariz a resolución completa

18:25y detalle antes de pasar

18:27a la próxima forma de la cara.

18:29En lugar de eso, es probable que sea

18:31posible dibujar

18:33los nostriles aproximadamente aquí y aquí,

18:35y los dos ojos aproximadamente aquí y aquí.

18:37Ahora pasamos un paso atrás

18:39y miramos la imagen en general.

18:41Estos parecen ser correctos en relación a uno al otro.

18:43Ahora empezamos a bajar

18:45a una de esas funciones y añadir detalles,

18:47tal vez uno de los ojos.

18:49Ahora volvemos a la vista de la gran imagen

18:51y realizamos que el ojo ahora parece bien,

18:53pero está un poco equivocado en proporción a la nariz,

18:55así que tenemos que ajustarlo.

18:57Siempre estamos mudando

18:59entre estas diferentes consideraciones.

19:01Y creo que eso es muy cierto en la ingeniería de software

19:03o en el trabajo científico,

19:05que tenemos que rellenar

19:07todas las piezas en relación a uno al otro

19:09y luego siempre volver a

19:11cómo todo esto se conecta.

19:13Si piensas en una tecnología

19:15que puede reasonar desde el primer principio,

19:17no es solo leer libros

19:19que hemos escrito sobre una enfermedad,

19:21puede hacer un trato y un error

19:23desde cero y llegar a soluciones de esa manera.

19:25Naturalmente, esto sería

19:27algo que nos llevaría a las ciencias

19:29y quizás nos llevaría a todas las cosas

19:31sobre las que tenemos espacios ocultos.

19:33Así que, en términos de proceso,

19:35creo que hay mucho que aprender

19:37de las herramientas de diseño

19:39y de cómo pensamos en herramientas

19:41para la ingeniería y las ciencias.

19:43Creo que estamos realmente en el precipicio

19:45de la AI jugando un papel muy,

19:47muy transformador en esos campos también.

19:49Estoy particularmente emocionado por esto

19:51porque parece a mí que, naturalmente

19:53y entendiblemente,

19:55es el papel que juega la AI en el mundo.

19:57Creo que, particularmente,

19:59si miramos su embedimiento

20:01en productos consumidos hoy en día,

20:03mucho de eso se siente

20:05como una especie de reemplazamiento

20:07del papel humano.

20:09Esta cosa puede escribir un esfuerzo

20:11para ti, esta cosa puede dibujar una foto

20:13para ti, así que parece como

20:15uno dentro y uno fuera.

20:17Pero, ya sabes, no debe ser un juego

20:19de cero suma, y particularmente

20:21cuando pensamos en cosas como

20:23ayuda, y creo que esto puede ser

20:25un juego de cero suma

20:27en el que usamos

20:29esta tecnología para ayudarnos

20:31en áreas en las que no podemos

20:33lidiar con la complejidad

20:35del espacio de posibilidades.

20:37Nosotros, por supuesto,

20:39por diseño, somos las personas

20:41que apuntan esto hacia

20:43algo, ¿verdad? Así que creo que la motivación,

20:45la etosa, si lo dices, viene de nosotros,

20:47pero la AI puede

20:49jugar un papel muy significativo

20:51para nosotros.

20:53Entonces, ¿qué lo hace difícil?

20:55Todo esto suena maravilloso, pero todos sabemos

20:57que no es fácil. ¿Qué lo hace difícil?

20:59Buena pregunta.

21:01Una cosa que en realidad ha sido un problema

21:03en la aplicación a las ciencias

21:05es la capacidad de simular

21:07el sistema

21:09en el que estamos actuando.

21:11Si miramos algo como aprendizaje de reemplazamiento

21:13y, digamos, la aplicación de DeepMind

21:15a juegos como Go y Chess,

21:17estos juegos son muy fácilmente simulados,

21:19sus reglas no son

21:21muy complicadas, así que, por supuesto,

21:23el juego puede ser simulado completamente.

21:25Entonces, un sistema de aprendizaje de reemplazamiento,

21:27que es básicamente un sistema de aprendizaje

21:29que opera similarmente a

21:31cómo entrenar a un perro,

21:33donde si toma la acción correcta, le da una recompensa,

21:35y si toma la acción errada, le da

21:37una recompensa. En el caso de un modelo de aprendizaje de máquinas,

21:39es una recompensa numérica,

21:41en lugar de comida,

21:43pero la misma idea básica.

21:45Estos tipos de sistemas son

21:47capaces de navegar espacios de posibilidades

21:49que son astronómicamente grandes.

21:51El espacio de posibilidades en Go

21:53es más grande que el número de átomos

21:55en el universo. En Go,

21:57solo tienes que jugar millones

21:59y millones de juegos dentro de un computador.

22:01Yo pienso que, comparado

22:03con los modelos de lenguaje grandes actualmente,

22:05esas cosas han leído más

22:07de lo que yo nunca leeré.

22:09Fundamentalmente, ellos han ingerido

22:11mucho más entendimiento

22:13de lenguaje que yo nunca,

22:15ni de cualquiera humano.

22:17Y aún así,

22:19he ayudado a su ejecución

22:21en mucho de lo que escribí.

22:23Debe haber algún enlace falso

22:25que no estamos muy conectados,

22:27y tal vez sea ese escándalo y el transferir

22:29que es un trozo de eso.

22:31Es cierto. Tu punto me lleva a algo

22:33que me parece muy, muy interesante.

22:35Algo que no sé que

22:37hubiera sido de alguna manera obvio

22:39para mí, si no hubiera sido por

22:41lo que ha pasado en los últimos años de la A.I.,

22:43que es que la omnisciencia

22:45en realidad tiene algunos desventajas.

22:49Estoy muy consciente de eso.

22:51Es como, resulta que

22:53leer todo

22:55puede ser

22:57una forma de ser

22:59un poco inopinionado

23:01o de no tener realmente

23:03una perspectiva en el mundo.

23:05Hay este proceso que se usa

23:07como parte del

23:09entrenamiento de modelos de lenguaje

23:11llamado RLHF,

23:13que significa Reinforcement Learning from Human Feedback.

23:15Y se usa para

23:17múltiples propósitos. Uno de ellos es

23:19para condicionar al modelo para hablar

23:21de una manera más conversacional,

23:23en lugar de una manera autocompleta

23:25en la que te termina la frase.

23:27Y eso es importante desde el punto de vista

23:29de experiencia del usuario. Pero también

23:31ayuda a perspectivizar al modelo

23:33para entender qué es una buena respuesta.

23:35La manera en que este proceso funciona

23:37es básicamente que tomas

23:39un modelo que ya está muy entrenado,

23:41le das un indicador,

23:43algún tipo de encuaderno,

23:45le pidas que genere múltiples respuestas,

23:47y luego te da un humano

23:49para dar una escala a cuál respuesta

23:51les pareció preferible. Así que esto

23:53puede ayudar a condicionar cosas como

23:55cuánto son conversacionales, chatos, amigables

23:57o no amigables para estar en la respuesta.

23:59Pero también tiene el efecto

24:01de singularizar la perspectiva

24:03del modelo. Así que no está

24:05mirando todo desde todos los ángulos,

24:07lo cual es equivalente a mirarlo

24:09desde todos los ángulos.

24:11Esa es una análoga interesante.

24:13Déjame transitar, teniendo en cuenta

24:15tus omnisiones. Tenemos un segmento

24:17donde intentamos hacer preguntas rápidas.

24:19Así que estamos buscando la primera

24:21cosa que nos venga a la mente.

24:23¿Qué crees que es la mayor oportunidad

24:25para la inteligencia artificial ahora?

24:27La ciencia avanzada.

24:29¿Cuál es la mayor preconcepción

24:31que la gente tiene?

24:33Que no hay futuro para los humanos.

24:35¿Cuál fue la primera carrera que querías?

24:37Cuando tenía cinco años,

24:39fue cuando la virtual realidad

24:41comenzó por primera vez.

24:43Y estaba muy emocionado

24:45por eso. Pensé que era muy guay

24:47y que haría replicas de

24:49capas de VR de aluminio,

24:51no funcionales, pero de diseño.

24:53Así que el diseñador de VR

24:55fue mi primera

24:57aspiración de carrera.

24:59¿Cuándo es demasiado

25:01inteligencia artificial?

25:03Buena pregunta.

25:05Cuando llegamos al punto en que

25:07no sentimos la motivación

25:09de intentar mejorar el mundo nosotros mismos.

25:11Si perdemos contacto con eso,

25:13entonces no hay sentido en la inteligencia artificial

25:15poder hacerlo.

25:17¿Cuál es una cosa que deseas que la inteligencia artificial

25:19pueda hacer ahora que no puede?

25:21Es divertido porque

25:23en mi propia vida me siento bastante contento

25:25con las cosas. No siento que hay

25:27alguna capacidad perdida.

25:29Así que me siento muy emocionado

25:31con la tecnología, pero al mismo tiempo

25:33es casi por el bien de ver

25:35lo que es posible, más que sentir

25:37que algo está faltando.

25:39Pero quizás más tangiblemente.

25:41¿Puedes construir un computador de 8 bits en Minecraft?

25:43Exactamente, exactamente.

25:45Sí, una especie de conquista intelectual,

25:47supongo.

25:49Pero no, creo que sería muy guay

25:51tener robots en casa.

25:53Esto es bastante fascinante.

25:55No puedo creer todos los temas que hemos cubierto.

25:57Creo que has abierto mis ojos

25:59con el diseño.

26:01Hay mucho que hemos hecho hasta ahora con el diseño,

26:03pero el potencial es realmente bastante fascinante.

26:05Gracias por tomar el tiempo de hablar con nosotros hoy.

26:07Muchas gracias por tenerme.

26:09Ha sido un placer.

26:11Ha sido una conversación muy divertida.

26:13Gracias por escuchar.

26:15La próxima vez que Sam y yo cerremos la temporada 9

26:17hablando con Joel Pinault,

26:19vicepresidente de investigación artificial en Meta.

26:21Por favor, acompáñanos.

26:23Gracias por escuchar a mí, a mí mismo y a la inteligencia artificial.

26:25Creemos, como ustedes,

26:27que la conversación sobre implementación artificial

26:29no empieza y no termina con este podcast.

26:31Es por eso que creamos un grupo en LinkedIn

26:33específicamente para escuchadores como ustedes.

26:35Se llama AI por Líderes.

26:37Y si se unen a nosotros, pueden hablar con los creadores y hosts del programa,

26:39preguntar sus propias preguntas,

26:41compartir sus conocimientos

26:43y obtener acceso a recursos valiosos

26:45sobre implementación artificial de MIT-SMR y BCG.

26:47Pueden acceder a ello

26:49visitando

26:51mitsmr.com

26:53forward slash AI for Leaders.

26:55Gracias por escucharnos y esperamos verte allí.

27:25www.mitsmr.com

Categoría

Transcripción

Recomendada