生成式人工智能应用
生成式人工智能是一种人工智能技术,能够通过学习已有数据生成新的数据,如图片、文本或音频。Nvidia Jetson是由NVIDIA开发的边缘AI平台,具有高性能处理能力和低功耗设计,适用于各种嵌入式和物联网设备。它支持深度学习、计算机视觉和其它AI应用,提供强大的计算能力和丰富的开发工具。生成式AI与Jetson的结合能在边缘设备上高效地进行本地实时生成和推断。
文本生成
文本生成是一项使用深度学习和大型语言模型来生成自然语言文本的技术。这些模型在大量数据集上进行训练,使它们能够学习语言的词汇、语法和语义结构。它们可以产生流畅且连贯的文本,不仅限于回答问题或进行对话,还包括写文章、创作故事、生成代码和翻译语言等任务。这里,我们在Jetson上部署文本生成算法,创建我们自己的本地聊天机器人。
本地AI助手 | 本地语音聊天机器人 |
---|---|
在Jetson设备上设置本地知识库,使用ollama和AnythingLLM。 | 使用Nvidia Riva和Meta Llama2构建本地运行的语音聊天机器人。 |
图像生成
图像生成通过解释输入的文本描述,使模型能够生成与描述相匹配的高质量图像。这项技术在艺术创作、广告设计和游戏开发等领域具有广泛的应用,使得自动化生成符合用户需求的视觉内容成为可能。
在本地运行LLM文本到图像 |
---|
在Jetson上部署图像生成模型并评估其推断性能。 |
音频生成
音频生成可以使用神经网络产生高质量、逼真的音频,包括语音、音乐和音效。通过在广泛的数据集上训练,这些模型学会复制自然声音的模式和细微差别,使得语音合成、自动音乐创作和音效创建等应用成为可能。
语音字幕生成 | 在 NVIDIA Jetson Orin 上部署 Whisper |
---|---|
在 Jetson 上进行语音字幕生成,能在不泄露互联网信息的情况下提供实时语音转字幕服务。 | 在 Jetson Orin 上部署 Whisper,构建强大、高效的语音转文本应用程序。 |
多模态生成
多模态生成技术结合了多种形式的数据,如文本、图像和声音,来创建整合多种信息类型的内容。此技术利用深度学习模型处理和融合来自不同模态的数据,产生更具表现力和多样性的内容。例如,文本到图像的模型可以基于文本描述生成对应的图像,而语音合成模型能从文本生成语音并同时生成相关图像。多模态生成在虚拟现实、增强现实和多媒体内容创建中展示了广泛的应用前景。
在 reComputer 上运行 VLM |
---|
本维基提供了在 reComputer J4012 Jetson Orin NX 上运行 VLM 的教程,使用 Jetson 平台服务。 |
检索增强生成
检索增强生成(RAG)是一种将检索机制与生成模型相结合的技术。RAG 模型不仅使用生成模型产生响应,还结合信息检索技术,通过从大型数据库中检索相关信息来增强生成内容的准确性和丰富性。此技术在问答系统、智能搜索和内容生成等应用中表现出色。通过利用检索的信息,RAG 模型能生成更详细和信息丰富的响应,从而提高生成内容的质量和相关性。
本地人工智能助手 | 本地 RAG 与 LlamaIndex |
---|---|
在 Jetson 设备上设置本地知识库,使用 ollama 和 AnythingLLM。 | 通过这个本地 RAG 项目,它可以保护您的数据隐私,并为您提供低延迟的沟通体验。 |
其他
在 Jetson 上微调 LLM | 使用 MLC 的量化 LLM | 零次检测 |
---|---|---|
在 Nvidia Jetson 上部署 Llama-Factory 并使用 Llama-Factory 训练大型语言模型。 | 在 Jetson Orin NX 上部署量化的 Llama2-7B 和 MLC LLM。 | 零次检测 AI 服务提供 REST API 端点来控制流输入和检测对象。 |
使用 Langchain 格式化输出 | ||
使用 Langchain 格式化大型语言模型的输出并在边缘计算设备上部署。 | ||
技术支持与产品讨论
感谢您选择我们的产品!我们在此提供各种支持,确保您使用我们的产品体验尽可能顺畅。我们提供几个沟通渠道,以满足不同的偏好和需求。