La personalización de ChatGPT con DALL-E 3 representa una integración significativa que permite a los usuarios de ChatGPT Plus y Enterprise generar imágenes únicas a partir de conversaciones simples. Aquí hay una descripción detallada de cómo funciona esta integración:
Generación de Imágenes a partir de Conversaciones:
- Con DALL-E 3, ChatGPT ahora puede crear imágenes únicas a partir de una conversación simple. Los usuarios pueden describir su visión, y ChatGPT proporcionará una selección de visuales que los usuarios pueden refinar e iterar. Los usuarios también pueden pedir revisiones directamente en el chat .
Mejora en la Interpretación y Representación de Detalles:
- DALL-E 3 puede crear imágenes a partir de instrucciones con lenguaje natural (prompts) dentro de ChatGPT, avanzando considerablemente en la interpretación de las partes del cuerpo humano. Puede responder a indicaciones extensas y representar de manera confiable detalles intrincados, incluidos texto, manos y rostro. Esto fue posible mediante el perfeccionamiento de la tecnología de subtitulado que se utilizó para entrenar a DALL-E 3, lo que resulta en que el modelo presta más atención a las instrucciones proporcionadas por el usuario.
- Adaptabilidad de la Proporción de Aspecto:
- Una mejora notable es que DALL-E 3 ahora permite cambiar la proporción de aspecto en sus imágenes, superando la limitación de la versión anterior que solo podía crear contenido en una proporción 1:1 (cuadrada). Ahora, los usuarios pueden indicar la proporción horizontal o vertical en el prompt de ChatGPT.
Mejoras en la Calidad de las Imágenes Generadas:
- DALL-E 3 genera imágenes que no solo son más visualmente atractivas sino también más nítidas en detalle. Puede renderizar de manera confiable detalles intrincados y responder bien a prompts detallados. También puede soportar tanto relaciones de aspecto de retrato como de paisaje. Estas capacidades se lograron entrenando un subtitulador de imágenes de última generación para generar mejores descripciones textuales para las imágenes, y luego DALL-E 3 fue entrenado en estas descripciones mejoradas.
Medidas de Seguridad:
- Se utiliza un sistema de seguridad de varios niveles para limitar la capacidad de DALL·E 3 de generar imágenes potencialmente dañinas, incluyendo contenido violento, adulto u odioso. Los controles de seguridad se ejecutan sobre los prompts de los usuarios y las imágenes resultantes antes de que se muestren a los usuarios. También se han tomado medidas para limitar la probabilidad de que el modelo genere contenido en el estilo de artistas vivos, imágenes de figuras públicas, y para mejorar la representación demográfica en las imágenes generadas.
Realimentación del Usuario:
- La realimentación del usuario es crucial para continuar mejorando. Los usuarios de ChatGPT pueden compartir sus comentarios con el equipo de investigación de OpenAI para informar sobre salidas inseguras o salidas que no reflejen con precisión el prompt proporcionado a ChatGPT
Esta integración refleja el compromiso de OpenAI de avanzar en la generación de imágenes mediante IA, al mismo tiempo que se mantienen altos estándares de seguridad y responsabilidad en el desarrollo y despliegue de la IA.