Keyword Searchとは
Keyword Searchとは、ユーザーが入力した文字列とデータベース内のテキストを完全に一致させることで情報
読み: キーワード・サーチ
ユーザーが入力した文字列とデータベース内のテキストを完全に一致させることで情報を抽出する従来型の検索手法である。文脈や意味を理解するAI時代のSemantic Searchと対比される概念であり、字句の出現頻度や文書の長さを計算して関連度をスコアリングする。
かんたんに言うと
図書館の蔵書検索機で書名を一言一句間違えずに入力して本を探す行為。タイトルが少しでも違えば、目の前の棚にその本があっても見つけることはできない。
Keyword Searchの仕組みと文字列一致で情報を探す従来型検索の限界
Keyword Searchの根幹は入力された文字列が文書内に存在するかどうかに懸かっている。TF-IDFやその後継であるBM25といったアルゴリズムが長年使われてきた。単語の出現頻度と希少性を計算し、スコアを弾き出す。
シンプルだが、奥が深い。
Semantic Searchのように文脈を理解するわけではないため、ユーザーの意図は無視される。だが、特定の型番や専門用語をピンポイントで探すなら、これほど確実な方法はない。BM25のパラメータ調整だけで検索精度を上げようと徹夜したエンジニアは私だけではないだろう。あの泥臭いチューニング作業は、今思い返しても胃が痛くなる。
企業内データ検索における活用事例と代表的ツール
製造業の部品管理や物流部門の在庫検索において、Keyword Searchは今も現役である。ElasticsearchやApache Solr、マネージドサービスであるAmazon OpenSearch Serviceがインフラを支えている。
例えば物流倉庫で「ネジM4 ステンレス」と検索する際、意味の類似性など不要である。必要なのは完全一致である。
しかし、法務部門の契約書検索システムにElasticsearchを導入した際、痛い目を見た。形態素解析の辞書に登録されていない新語や造語が全くヒットしなかったのである。辞書のメンテナンスを誰がやるのかで法務と開発が揉めるのは、現場の風物詩と言っていい。
キーワード検索が抱える限界と導入のメリット
最大の弱点は表記揺れである。「引越」と「引っ越し」の違いだけで情報が漏れる。LLMを用いたRAGを構築する際、このKeyword Searchの限界が検索漏れを引き起こし、AIの回答精度を著しく下げる原因になる。
では、すべてをベクトル化してしまえばいいのか。
そう単純ではない。Keyword Searchの処理速度とインフラコストの安さは、依然として魅力的である。数千万件のレコードからミリ秒単位で結果を返すパフォーマンスを、最新のAI検索で安価に実現できるだろうか。コストと精度のバランスをどこで取るか、設計者の判断が分かれるところである。
自社の状況に最適な検索手法を選ぶための判断基準
現在、RAGの検索基盤として主流になりつつあるのが、Keyword SearchとVector Searchを組み合わせたHybrid Searchである。
法務の過去判例検索を想像してほしい。Vector Searchだけでは「第14条」といった具体的な条文番号が埋もれてしまう。そこでKeyword Searchの出番となる。両者のスコアをどう重み付けするか。アルファ値を0.5に固定して逃げるエンジニアをよく見るが、それではどちらの良さも殺してしまう。
業務の性質に合わせて検索手法をどうブレンドするか。正解のない問いに立ち向かうのは、本当に悩ましい。
当社の見解
当社はAI長期記憶システムを自社開発・運用している(2026年4月現在、1,655件の記憶データを蓄積)。この仕組みにより、AIが過去3ヶ月分の経営判断や設計方針を文脈ごと保持し、「前にも同じ話をしましたよね」という手戻りが激減した。セッションが切れても議論の続きから再開できるため、壁打ち相手としてのAIの価値が根本的に変わった。技術的にはCognee MCPサーバーによる記憶保存と、FastEmbed(ONNX Runtime)+ LanceDBによる非常駐型ベクトル検索(検索レイテンシ8ms、GPU不要)を採用。Hindsight(LongMemEval 91.4%精度)やomega-memoryなど複数の既製品を実環境で検証・棄却した上での選定であり、「個人PCでもエンタープライズでも負荷なく動く軽量さ」を最優先に設計している。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
