Skip to main content

reComputer-Jetson®による生成AI

生成AIは、既存のデータから学習することで、画像、テキスト、音声などの新しいデータを生成できる人工知能技術です。Nvidia Jetsonは、NVIDIAが開発したエッジAIプラットフォームで、高性能処理能力と低消費電力設計を特徴とし、様々な組み込みデバイスやIoTデバイスに適しています。深層学習、コンピュータビジョン、その他のAIアプリケーションをサポートし、強力な計算能力と豊富な開発ツールセットを提供します。生成AIとJetsonの組み合わせにより、エッジデバイス上で効率的なローカルリアルタイム生成と推論が可能になります。

テキスト生成

テキスト生成は、深層学習と大規模言語モデルを使用して自然言語テキストを生成する技術です。これらのモデルは大規模なデータセットで訓練されており、言語の語彙、文法、意味構造を学習できます。流暢で一貫性のあるテキストを生成でき、質問への回答や会話に限定されず、記事の執筆、物語の創作、コードの生成、言語翻訳などのタスクも含みます。ここでは、Jetson上にテキスト生成アルゴリズムを展開して、独自のローカルチャットボットを作成します。

ローカルAIアシスタントローカル音声チャットボット
ollamaとAnythingLLMを使用してJetsonデバイス上にローカル知識ベースを構築します。Nvidia RivaとMeta Llama2を使用してローカル動作する音声チャットボットを構築します。

画像生成

画像生成は、入力されたテキスト記述を解釈することで、記述に一致する高品質な画像をモデルが生成することを可能にします。この技術は、芸術創作、広告デザイン、ゲーム開発などの分野で幅広く応用されており、ユーザーのニーズに合った視覚的コンテンツの自動生成を実現します。

ローカルLLMテキスト-画像変換の実行
Jetson上に画像生成モデルをデプロイし、その推論性能を評価します。

音声生成

音声生成は、ニューラルネットワークを使用して、音声、音楽、効果音を含む高品質で現実的な音声を生成することができます。広範なデータセットでトレーニングすることにより、これらのモデルは自然な音のパターンとニュアンスを複製することを学習し、音声合成、自動音楽作曲、効果音作成などのアプリケーションを可能にします。

音声字幕生成NVIDIA Jetson OrinでのWhisperデプロイ
Jetsonでの音声字幕生成は、インターネット上での情報漏洩を回避しながら、リアルタイムの音声から字幕へのサービスを提供できます。 Jetson Orin上でWhisperをデプロイして、堅牢で効率的なSTTアプリケーションを構築します。

マルチモーダル生成

マルチモーダル生成技術は、テキスト、画像、音声などの様々な形式のデータを組み合わせて、複数の種類の情報を統合したコンテンツを作成します。この技術は深層学習モデルを使用して異なるモダリティからのデータを処理・融合し、より表現力豊かで多様なコンテンツを生成します。例えば、テキストから画像への変換モデルはテキストの説明に基づいて対応する画像を生成でき、音声合成モデルはテキストから音声を生成すると同時に関連する画像を生成できます。マルチモーダル生成は、バーチャルリアリティ、拡張現実、マルチメディアコンテンツ作成において幅広い応用の可能性を示しています。

reComputer上でVLMを実行
このwikiでは、Jetson Platform ServicesでreComputer J4012 Jetson Orin NX上でVLMを実行する方法のチュートリアルを提供します。

検索拡張生成

RAG(Retrieval-Augmented Generation)は、検索メカニズムと生成モデルを組み合わせた技術です。RAGモデルは、生成モデルを使用して応答を生成するだけでなく、情報検索技術を組み込んで、大規模データベースから関連情報を検索することで、生成されるコンテンツの精度と豊富さを向上させます。この技術は、質問応答システム、インテリジェント検索、コンテンツ生成などのアプリケーションで優れた性能を発揮します。検索された情報を活用することで、RAGモデルはより詳細で情報豊富な応答を生成でき、生成されるコンテンツの品質と関連性を向上させることができます。

ローカルAIアシスタントLlamaIndexを使用したローカルRAG
ollamaとAnythingLLMを使用してJetsonデバイス上にローカル知識ベースを構築します。 このローカルRAGプロジェクトにより、データプライバシーを保護し、低遅延の通信体験を提供できます。

その他

Jetson上でのLLMファインチューニングMLCによる量子化LLMゼロショット検出
Nvidia Jetson上にLlama-Factoryをデプロイし、Llama-Factoryを使用して大規模言語モデルを訓練します。 Jetson Orin NX上でMLC LLMを使用して量子化されたLlama2-7Bをデプロイします。 Zero Shot Detection AIサービスは、ストリーム入力と検出するオブジェクトを制御するREST APIエンドポイントを公開します。
Langchainによる出力フォーマット
Langchainを使用して大規模言語モデルの出力をフォーマットし、エッジコンピューティングデバイスにデプロイします。

技術サポート & 製品ディスカッション

弊社製品をお選びいただき、ありがとうございます!お客様の製品体験を可能な限りスムーズにするため、さまざまなサポートを提供いたします。異なる好みやニーズに対応するため、複数のコミュニケーションチャンネルをご用意しています。

Loading Comments...