AI・機械学習

Tree of Thoughts アイキャッチ生成AI・LLM

Tree of Thoughts(ツリーオブソーツ)とは?読み方・LLM推論を木構造で深化させるプロンプト技法の仕組み・Chain of Thoughtとの違い・Game of 24での74%実績を完全解説

Tree of Thoughts(ツリーオブソーツ)とは、Yao et al.が2023年に発表したLLM推論フレームワーク。Chain of Thoughtの拡張で複数経路を木構造で探索し、Game of 24で74%精度(CoTの4%)を達成した仕組み・実装パターンを完全解説。

Test-time Compute アイキャッチ機械学習・ディープラーニング

Test-time Compute(テストタイムコンピュート)とは?読み方・推論時計算スケーリングの仕組み・OpenAI o1/o3・DeepSeek-R1で注目される推論モデル時代の鍵を完全解説

Test-time Compute(テストタイムコンピュート)とは、LLMが推論時により多くの計算量を使って精度を上げる手法。OpenAI o1/o3やDeepSeek-R1で注目される推論時スケーリングの仕組み・Chain of Thoughtとの違い・実装パターン・コストトレードオフを完全解説。

Codestral アイキャッチ生成AI・LLM

Codestral(コーデストラル)とは?読み方・Mistralのコーディング特化LLMの仕組み・25.01/25.08の違い・HumanEvalスコア・ローカル実行を完全解説

Codestral(コーデストラル)とは、Mistral AIが2024年5月に発表したコーディング特化型のLLM。22Bパラメータ、80以上の言語対応、256Kトークン文脈、HumanEval 86.6%などの性能とローカル実行・GitHub Copilot代替・25.08最新版を完全解説。

Mamba機械学習・ディープラーニング

Mamba(マンバ)とは?読み方・Selective State Space Modelの仕組み・Transformerとの違い・ハイブリッドアーキテクチャまで完全解説

Mambaとは、Albert Gu/Tri Daoが2023年に発表したSelective State Space Modelで、Transformerの2乗計算問題を線形時間で解決する仕組みです。本記事では読み方・Mamba-2/3の進化・Transformerとの違い・ハイブリッド採用例まで完全解説します。

Speculative Decoding機械学習・ディープラーニング

Speculative Decoding(スペキュラティブデコーディング)とは?読み方・LLM推論を2〜3倍高速化する仕組み・vLLM/EAGLE/Medusaの違いを完全解説

Speculative Decodingとは、軽量なドラフトモデルが先読み予測し、ターゲットモデルが一括検証することでLLM推論を2〜3倍高速化する仕組みです。Rejection Samplingにより出力品質は数学的に保証され、vLLMやTGI等の主要推論サーバが標準対応しています。

Qwen3生成AI・LLM

Qwen3(クウェンスリー)とは?読み方・Alibabaのオープンウェイト大規模言語モデル(Qwen3.6-27B/Max-Preview)の仕組み・性能・Llama 4との違いを完全解説

Qwen3とは、中国Alibabaが開発するオープンウェイトの大規模言語モデルシリーズで、2026年4月にリリースされたQwen3.6-27BはSWE-bench Verified 77.2点を記録し、Claude 4.5 Opusに匹敵する仕組みです。本記事では読み方・性能・Llama 4との違いを完全解説します。

Codex CLI生成AI・LLM

Codex CLI(コーデックスシーエルアイ)とは?読み方・OpenAIが提供するターミナル動作のAIコーディングエージェントの仕組み・使い方・Claude Codeとの違いを完全解説

Codex CLIとは、OpenAIが提供するオープンソースのターミナル型AIコーディングエージェントで、Rustで実装されGPT-5.5などをバックエンドに使う仕組みです。本記事では読み方・使い方・Claude Codeとの違いを完全解説します。

Message Batches API生成AI・LLM

Message Batches API(メッセージバッチエスエピーアイ)とは?読み方・Anthropicが提供する50%割引非同期処理APIの仕組み・使い方・通常APIとの違いを完全解説

Message Batches APIとは、Anthropicが提供するClaude向けの非同期バッチ処理APIで、最大100,000リクエストを24時間以内に通常の50%の料金で処理できる仕組みです。本記事では読み方・使い方・通常APIとの違いを完全解説します。