2026年5月

KV Cache（ケーブイキャッシュ）とは？読み方・LLM推論を高速化する仕組み・GPUメモリへの影響・Prompt Cachingとの違いを完全解説

KV Cacheとは、Transformer型LLMの推論時にKey/Valueテンソルを再利用して計算量を線形に抑える仕組み。読み方・仕組み・Prompt Cachingとの違い・PagedAttention/vLLMとの関係を図解で完全解説します。

LangChainとは、LLMアプリやAIエージェントを構築するためのオープンソースフレームワーク。読み方・仕組み・LangGraph・deepagents・LangSmithとの関係・他フレームワークとの違いを実装サンプル付きで解説します。

Manusとは、中国発祥（シンガポール拠点）のButterfly Effect社が開発した自律型AIエージェントのこと。読み方・仕組み・マルチエージェント構造・Claudeとの違い・2026年4月のMeta買収阻止までの動向を解説します。

Bash Toolとは、Anthropic Claude APIに組み込まれた公式ツールで、Claudeに永続bashセッションでシェルコマンドを実行させる仕組み。読み方・使い方・Computer Useや独自ツール定義との違い・実装パターンを解説します。

Files APIとは、AnthropicのClaude APIでファイルを永続的に保存・参照できるエンドポイントのこと。読み方・仕組み・PDFやExcelをfile_idで再利用する方法・OpenAIのFiles APIとの違いを実装サンプル付きで解説します。

In-context Learning（ICL）はプロンプト内の例示だけでLLMを新タスクに対応させる仕組み。Zero-shot/Few-shot/Chain-of-Thoughtの違い、Fine-tuningとの比較、実装パターンまで完全解説。

Quantization（量子化）はLLMの重みを低精度に変換してメモリと速度を改善する技術。FP16/INT8/INT4の違い、GPTQ・AWQ・GGUFの仕組み、ハルシネーションへの影響、ローカル運用パターンを完全解説。

Hallucination（ハルシネーション）とはLLMが事実に反する情報をもっともらしく出力する現象。原因・種類・RAG/Constitutional AI/Calibrationによる抑制策、2026年の最新研究まで完全解説。

Aider（エイダー）はターミナルで動くオープンソースのAIペアプログラミングツール。Git連携、複数モデル対応、編集モードの仕組みからCursor・Claude Codeとの違い、実装パターンまで完全解説。

Token Counting（トークンカウンティング）はLLMに送信するメッセージのトークン数を事前に数える仕組み。AnthropicのToken Counting APIの使い方、料金見積もり、レート制限、実装パターンを完全解説。