Parent Document Retrievalとは
Parent Document Retrievalとは、RAGにおいて、細かい情報の断片ではなく、それを含む大きな文書単位で検索を行う手法である
読み: Parent Document Retrieval
かんたんに言うと
本の内容を探す際、単なる一文の抜き出しではなく、その文が含まれる章全体を読み込むことで内容を正確に把握するような仕組みである。
仕組みと背景
一般的なRAGでは文書を細切れにして検索するが、これでは文脈が失われることがある。Parent Document Retrievalは文書を階層化し、細かい断片を検索した後にその親となる文書全体をLLMに渡す。これにより、断片的な情報と全体像の両方を多モーダルAIに提供することが可能となる。
実務上の利点
複雑な社内規定や技術マニュアルを扱う現場で特に効果を発揮する。情報の断片だけでは判断が難しい質問に対しても、親文書という広い文脈があることで回答の精度が向上する。結果として、LLMが誤った解釈をするリスクを低減できる。
導入における留意点
この手法は一度に扱うデータ量が増えるため、処理コストや速度に影響を与える側面がある。すべての文書に適用するのではなく、情報の関連性が重要な複雑な文書群に対して選択的に導入するのが現実的である。システム設計時には検索の重さと回答精度のバランスを見極める必要がある。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
