NVIDIA DGX Sparkの革新的なコンパクト設計と、GBase On-premの高精度RAG技術を組み合わせたGBase on Sparkで、現実的なコストで社内知識ベース+AIエージェントを構築
NVIDIA DGX Spark
従来のGPUサーバーでは実現できなかった、低コスト・静音・コンパクトな次世代AIインフラ
従来のGPUサーバー(数百万円〜)に対し、約1/20のコストでオンプレLLM環境を構築可能
1/20 コスト削減通常のオフィス環境で稼働中でもほとんど気にならないレベルのノイズ。専用サーバールーム不要
一般的なデスクトップPCと同等かそれ以下のサイズ感。オフィスの一角にそのまま設置可能
スケーラビリティ
2台のSpark連携で最大405Bパラメータモデルに対応。将来的なスケールアウトも視野に
128GB統合メモリで200Bパラメータモデルまで対応。社内FAQ、ナレッジ検索に十分な性能
200Gb/s QSFPで接続し、256GBメモリプールを実現。405Bの大規模モデルも動作可能
市販モデルをそのまま購入。カスタムサーバー発注の長期リードタイムを回避
搭載可能モデル
GBase on Sparkでは、最先端のオープンソースLLMをインストール可能
OpenAIが公開した初のオープンウェイト推論モデル。GPT-4oクラスの性能をApache 2.0ライセンスで提供
Alibabaが開発した次世代MoEモデル。10倍の推論速度と超長文コンテキストに対応
※ ベンチマークスコアは各モデルの公式発表値に基づいています
GBase on Spark
量子化LLM + ARM最適化により、Spark 1台で企業向けAI基盤を実現
LLM推論やRAG検索をすべて社内ネットワーク内で完結。機密情報をクラウドに送信する必要がなく、ゼロトラストやデータ主権の要件に対応
LLM+VLMのデュアル構成により、手書きメモ、スキャン文書、図解付きマニュアルなど、あらゆる複雑ドキュメントを理解・回答可能
Sparkがデータの前処理・更新エンジンとして機能。新規文書追加時に自動でRAGインデックス更新し、常に最新状態を維持
ブラウザベースの管理画面と自動ログ取得・モニタリング機能により、ほぼメンテナンスフリーの運用体制を構築
活用シーン
様々な業界・部門で実践的な価値を創出
IT・総務・人事部門の問い合わせ対応を24時間自動化
検索しづらかった非構造化資産を全社横断で即時活用可能に
設備マニュアル・故障履歴・保守ログを統合活用
エンタープライズセキュリティ
金融・公共・製造など、クラウド前提の運用に踏み切りづらい組織にも最適
すべてのLLM推論・RAG検索を社内ネットワーク内で完結。機密情報や社外秘資料をクラウドに送信する必要がありません
ユーザー・グループ単位での細かなアクセス権限設定により、情報漏洩リスクを最小化
「誰が・いつ・どの情報にアクセスしたか」を完全記録。内部統制やコンプライアンス要件に対応
自社データセンター/プライベートクラウドで運用。海外クラウドへのデータ移転リスクを完全排除
今後の展開
ナレッジ活用から文書作成まで、業務効率化を一気通貫で実現
会議音声から自動で議事録を生成。要点抽出、アクションアイテムの整理、参加者への共有まで一括対応。過去の会議内容もナレッジベースに蓄積し、いつでも検索可能に
近日公開予定蓄積されたナレッジから、定型回答書・FAQマニュアル・提案書テンプレートなどを自動作成。問い合わせ対応から文書作成業務まで一気通貫で効率化
近日公開予定「社内資料検索」「社内ヘルプデスク」「特定部門のナレッジ共有」など、
貴社の1つの業務シーンを選んでスモールスタート