Skip to main content

IA Generativa con reComputer-Jetson®

IA Generativa es una tecnología de inteligencia artificial que puede generar nuevos datos, como imágenes, texto o audio, aprendiendo de datos existentes. Nvidia Jetson es una plataforma de IA de borde desarrollada por NVIDIA, que cuenta con capacidades de procesamiento de alto rendimiento y diseño de bajo consumo, adecuada para varios dispositivos embebidos e IoT. Soporta aprendizaje profundo, visión por computadora y otras aplicaciones de IA, ofreciendo potentes capacidades de cómputo y un conjunto rico de herramientas de desarrollo. La combinación de IA Generativa y Jetson permite generación e inferencia local eficiente en tiempo real en dispositivos de borde.

Generación de Texto

La generación de texto es una tecnología que utiliza aprendizaje profundo y modelos de lenguaje grandes para generar texto en lenguaje natural. Estos modelos se entrenan en conjuntos de datos masivos, permitiéndoles aprender el vocabulario, gramática y estructura semántica del lenguaje. Pueden producir texto fluido y coherente, no solo limitado a responder preguntas o participar en conversaciones, sino también incluyendo tareas como escribir artículos, crear historias, generar código y traducir idiomas. Aquí, estamos desplegando algoritmos de generación de texto en Jetson para crear nuestro propio chatbot local.

Asistente de IA LocalChatbot de Voz Local
Configurar una base de conocimiento local en dispositivos Jetson con ollama y AnythingLLM.Construir un chatbot de voz operado localmente con Nvidia Riva y Meta Llama2.

Generación de Imágenes

La generación de imágenes, al interpretar descripciones de texto de entrada, permite a los modelos producir imágenes de alta calidad que coinciden con las descripciones. Esta tecnología tiene aplicaciones amplias en campos como la creación artística, diseño publicitario y desarrollo de juegos, permitiendo la generación automatizada de contenido visual que satisface las necesidades del usuario.

Ejecutar un LLM Local de Texto a Imagen
Desplegar el modelo de generación de imágenes en Jetson y evaluar su rendimiento de inferencia.

Generación de Audio

La generación de audio puede producir audio de alta calidad y realista, incluyendo habla, música y efectos de sonido, utilizando redes neuronales. Al entrenar con extensos conjuntos de datos, estos modelos aprenden a replicar patrones de sonido naturales y matices, habilitando aplicaciones como síntesis de voz, composición musical automatizada y creación de efectos de sonido.

Generación de Subtítulos de VozDesplegar Whisper en NVIDIA Jetson Orin
Generación de Subtítulos de Voz en Jetson, que puede ofrecer servicios de voz a subtítulos en tiempo real mientras evita la fuga de información en internet. Desplegando Whisper en el Jetson Orin para construir aplicaciones STT robustas y eficientes.

Generación Multimodal

La tecnología de generación multimodal combina varias formas de datos, como texto, imágenes y sonido, para crear contenido que integra múltiples tipos de información. Esta tecnología utiliza modelos de aprendizaje profundo para procesar y fusionar datos de diferentes modalidades, resultando en contenido más expresivo y diverso. Por ejemplo, los modelos de texto a imagen pueden generar imágenes correspondientes basadas en descripciones textuales, mientras que los modelos de síntesis de voz pueden producir habla a partir de texto y simultáneamente generar imágenes relacionadas. La generación multimodal muestra amplias perspectivas de aplicación en realidad virtual, realidad aumentada y creación de contenido multimedia.

Ejecutar VLM en reComputer
Esta wiki proporciona un tutorial sobre cómo ejecutar VLM en reComputer J4012 Jetson Orin NX con Jetson Platform Services.

Generación Aumentada por Recuperación

RAG (Retrieval-Augmented Generation) es una tecnología que combina mecanismos de recuperación con modelos de generación. El modelo RAG no solo utiliza un modelo generativo para producir respuestas, sino que también incorpora técnicas de recuperación de información para mejorar la precisión y riqueza del contenido generado mediante la recuperación de información relevante de grandes bases de datos. Esta tecnología sobresale en aplicaciones como sistemas de preguntas y respuestas, búsqueda inteligente y generación de contenido. Al aprovechar la información recuperada, los modelos RAG pueden generar respuestas más detalladas y ricas en información, mejorando así la calidad y relevancia del contenido generado.

Asistente de IA LocalRAG Local con LlamaIndex
Configurar una base de conocimiento local en dispositivos Jetson con ollama y AnythingLLM. Con este proyecto RAG local, puede proteger la privacidad de sus datos y proporcionarle una experiencia de comunicación de baja latencia.

Otros

Ajuste fino de LLM en JetsonLLM Cuantizado con MLCDetección Zero-Shot
Despliega Llama-Factory en Nvidia Jetson y usa Llama-Factory para entrenar un modelo de lenguaje grande. Desplegando el Llama2-7B cuantizado con MLC LLM en el Jetson Orin NX. El servicio de IA de Detección Zero Shot expone endpoints de API REST para controlar la entrada de flujo y los objetos a detectar.
Formatear Salida con Langchain
Usa Langchain para formatear la salida de modelos de lenguaje grandes y desplegarlo en dispositivos de computación en el borde.

Soporte Técnico y Discusión de Productos

¡Gracias por elegir nuestros productos! Estamos aquí para brindarte diferentes tipos de soporte para asegurar que tu experiencia con nuestros productos sea lo más fluida posible. Ofrecemos varios canales de comunicación para satisfacer diferentes preferencias y necesidades.

Loading Comments...