Formatear salida con Langchain

Introducción

En las familias modernas, la tendencia hacia los hogares inteligentes se está volviendo cada vez más común. Puedes transformar tu hogar en un espacio de vida más inteligente y conveniente conectando dispositivos inteligentes, automatización y tecnología de inteligencia artificial. Con este fin, planeamos integrar LLM en HomeAssistant para crear un asistente doméstico más inteligente. El primer paso para lograr este objetivo es permitir que LLM genere señales de control que puedan gestionar dispositivos domésticos inteligentes.

En esta wiki, aprenderás cómo usar Langchain para formatear la salida de modelos de lenguaje grandes y desplegarlo en dispositivos de computación en el borde. Específicamente, usar la poderosa capacidad de comprensión de los modelos de lenguaje grandes para construir un chatbot local, y luego utilizar las herramientas de Langchain para fijar el formato de salida del modelo grande.

¿Qué es LLM?

Los Modelos de Lenguaje Grandes (LLM) son un tipo de modelo de inteligencia artificial basado en aprendizaje profundo, como GPT, que sobresalen en tareas de procesamiento de lenguaje natural. Son capaces de entender y generar texto, y por lo tanto se utilizan ampliamente en varias aplicaciones como generación de texto, traducción, sistemas de preguntas y respuestas, y más.

¿Por qué es necesario formatear la salida de LLM?

Formatear la salida de un Modelo de Lenguaje Grande (LLM) es importante para hacerla más comprensible y adaptada a aplicaciones específicas. A menudo, el texto generado por un LLM puede incluir información redundante, detalles innecesarios, o contenido que está formateado de manera inconsistente. Al formatear la salida, puedes asegurar que el texto cumpla con estándares específicos, eliminar partes no deseadas, y asegurar que se alinee con los requisitos de tu aplicación. Este proceso es crucial para integrar efectivamente las salidas de LLM en varios sistemas y aplicaciones, asegurando que el contenido generado sea tanto relevante como útil.

¿Cómo formatear la salida de LLM?

Aquí, podemos utilizar una herramienta muy amigable para el usuario—Langchain. Es un marco poderoso diseñado para ayudar a los desarrolladores a construir aplicaciones de extremo a extremo usando modelos de lenguaje. Ofrece un conjunto de herramientas, componentes e interfaces que simplifican el proceso de crear aplicaciones soportadas por Modelos de Lenguaje Grandes y modelos de chat.

¿Cómo desplegar en dispositivos de borde?

Paso 1. Necesitarás preparar un dispositivo Jetson (reComputer J4012) equipado con el sistema operativo Jetpack 5.0+.

Paso 2. Abre la terminal e instala el software de dependencias correspondiente.

pip3 install --no-cache-dir --verbose langchain[llm] openai
pip3 install --no-cache-dir --verbose gradio==3.38.0

Paso 3. Crea un nuevo script de Python, llamado format_opt.py, e inserta el siguiente código en él.

format_opt.py

import copy

import gradio as gr
from langchain.llms import LlamaCpp
from langchain.output_parsers import StructuredOutputParser, ResponseSchema
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
import os
os.environ["OPENAI_API_KEY"] = "your openai api key"


class ChatBot:
    def __init__(self, llama_model_path=None,history_length=3):
        self.chat_history = []
        self.history_threshold = history_length
        self.llm = None
        if llama_model_path is not None:
            self.llm = LlamaCpp(
                model_path=llama_model_path,
                temperature=0.75,
                max_tokens=2000,
                top_p=1
            )
        else:
            self.llm = OpenAI(model_name="text-davinci-003")

        response_schemas = [
            ResponseSchema(name="user_input", description="This is the user's input"),
            ResponseSchema(name="suggestion", type="string", description="your suggestion"),
            ResponseSchema(name="control", description="This is your response"),
            ResponseSchema(name="temperature", type="int", description="This is used to indicate the degrees "
                                                                       "centigrade temperature of the air conditioner.")
        ]
        self.output_parser = StructuredOutputParser.from_response_schemas(response_schemas)
        self.format_instructions = self.output_parser.get_format_instructions()

        self.template = """
            Now you are a smart speaker, and you need to determine whether to turn on the air conditioner based on the
            user's input.
            In the suggestion section, please reply normal conversation.
            In the control section, if you need to turn on the air conditioner, please reply with <1>; if you need to 
            turn off the air conditioner, please reply with <0>.
            
            {format_instructions}
            
            Please do not generate any comments.
            
            % USER INPUT:
            {user_input}

            YOUR RESPONSE:
        """
        self.prompt = PromptTemplate(
            input_variables=["user_input"],
            partial_variables={"format_instructions": self.format_instructions},
            template=self.template
        )

    def format_chat_prompt(self, message):
        prompt = ""
        for turn in self.chat_history:
            user_message, bot_message = turn
            prompt = f"{prompt}\nUser: {user_message}\nAssistant: {bot_message}"
        prompt = f"{prompt}\nUser: {message}\nAssistant:"
        return prompt

    def respond(self, message):
        prompt = self.prompt.format(user_input=message)
        formatted_prompt = self.format_chat_prompt(prompt)
        bot_message = self.llm(formatted_prompt)
        # self.output_parser.parse(bot_message)

        if len(self.chat_history) >= self.history_threshold:
            del self.chat_history[0]
        self.chat_history.append((message, bot_message))
        return "", self.chat_history

    def run_webui(self):
        with gr.Blocks() as demo:
            gr.Markdown("# This is a demo for format output of LLM")
            chatbot = gr.Chatbot(height=500)
            msg = gr.Textbox(label="Prompt")
            btn = gr.Button("Submit")
            clear = gr.ClearButton(components=[msg, chatbot], value="Clear console")

            btn.click(self.respond, inputs=[msg], outputs=[msg, chatbot])
            msg.submit(self.respond, inputs=[msg], outputs=[msg, chatbot])

        gr.close_all()
        demo.launch()


if __name__ == '__main__':
    chatbot_ins = ChatBot("/home/nvidia/Mirror/llama-2-7b-chat.Q4_0.gguf")
    chatbot_ins.run_webui()

Paso 4. Ingresa python3 format_opt.py en la terminal para iniciar el script, y luego visita http://127.0.0.1:7861/ en un navegador para acceder a la WebUI y probar los efectos.

¿Plan de próximos pasos?

Integrar con Nvidia Riva para reemplazar la entrada de texto con interacción por voz.
Conectar a Home Assistant para controlar dispositivos domésticos inteligentes usando la salida de LLM.

Soporte Técnico y Discusión de Productos

¡Gracias por elegir nuestros productos! Estamos aquí para brindarte diferentes tipos de soporte para asegurar que tu experiencia con nuestros productos sea lo más fluida posible. Ofrecemos varios canales de comunicación para atender diferentes preferencias y necesidades.

Introducción​

¿Qué es LLM?​

¿Por qué es necesario formatear la salida de LLM?​

¿Cómo formatear la salida de LLM?​

¿Cómo desplegar en dispositivos de borde?​

¿Plan de próximos pasos?​

Soporte Técnico y Discusión de Productos​