Codestral（コーデストラル）とは？読み方・Mistralのコーディング特化LLMの仕組み・25.01/25.08の違い・HumanEvalスコア・ローカル実行を完全解説

Q: Codestralは無料で使えますか？

研究・テスト用途では非製品ライセンスの範囲で無料です。商用本番運用にはMistral社との契約が必要なケースが多く、利用前にライセンス条項を確認してください。

Q: ローカル実行に必要なスペックは？

フル精度なら40GB以上のGPU VRAMが必要、量子化版なら16GB前後でも動作します。

Q: CodestralとDevstralの違いは？

Devstralは2025年5月リリースのエージェント特化モデルで、複数ファイルにまたがる自律的な編集タスクで強みを発揮します。

Q: 日本語のコメント生成は得意ですか？

学習データが英語中心のため、日本語コメントの自然さで劣る場面があります。日本語UI向けにはプロンプト調整が必要です。

Codestral（コーデストラル）とは、Mistral AIが2024年5月に発表したコーディング特化型の大規模言語モデル（LLM）のこと。22Bパラメータのオープンウェイトモデルで、Python・Java・C・C++・JavaScript・Bash等80以上のプログラミング言語に対応している。256Kトークンの広大な文脈窓を持ち、リポジトリ全体を一度に読み込んでリファクタリングや補完を行える点が特徴です。

Codestralの位置づけは「軽量で高速、しかもローカルで動かせるコーディング特化モデル」。OpenAIのGPTシリーズやAnthropicのClaudeに比べて、ライセンス上は研究・テスト用途が中心になるが、自前のGPU環境で動かしたいエンタープライズや、データを外部に出せない開発組織にとって有力な選択肢になっている。実務では、GitHub Copilot代替・コードレビュー自動化・社内開発支援といったユースケースで採用が進んでいます。

Codestralの読み方

コーデストラル

コードストラル

Codestralの仕組み

CodestralはMistralのMistral-Medium系をベースにコード生成・補完タスクに特化させたモデル。重要なポイントは、Fill-in-the-Middle（FIM）と呼ばれる機能を持ち、単純な前方補完だけでなく「ファイルの途中に挿入する」用途に最適化されている点です。これによりIDE上でのインライン補完体験が、汎用LLMより格段に滑らかになる。実務では、この差が生産性に直結するため重要です。

Codestralのリリース変遷

2024/5
初代
22B / 32K

2025/1
v25.01
HumanEval 86.6%
256K文脈

2025/5
Devstral登場
エージェント特化

2025/8
v25.08
本番安定性UP

v25.01の主な改善点

2025年1月のv25.01アップデートでは、文脈窓が32Kから256Kトークンに拡張された。これは中規模リポジトリ全体を一度にロードできる規模で、複数ファイルにまたがるリファクタリングや、巨大な設定ファイルのレビューが可能になった。実務では、この文脈窓の広さがv25.01の最大の進化点と覚えておきたいポイントです。さらにLMSysのCopilot Arenaリーダーボードで首位を獲得し、HumanEvalスコアは86.6%を記録している。

v25.08の主な改善点

2025年8月のv25.08は「能力向上」より「本番安定性向上」に重点を置いたリリース。Mistralの公式発表によると、補完受け入れ率が30%向上し、誤生成のレポート件数が50%減少した。エンタープライズ向けに「Mistral Coding Stack」がパッケージ化され、IDE統合・社内デプロイの導入障壁が下がっている。本番環境の信頼性向上は重要です。

Codestralの使い方・実例

基本的な使い方（Quick Start）

# Mistral公式APIから呼び出す例
from mistralai import Mistral

client = Mistral(api_key="YOUR_API_KEY")
response = client.chat.complete(
    model="codestral-latest",
    messages=[
        {"role": "user", "content": "Python で1〜100の素数を出力する関数を書いて"}
    ]
)
print(response.choices[0].message.content)

よくある実装パターン

パターンA: Fill-in-the-Middle（FIM）でIDE補完

# suffix を渡すことで「中間挿入」になる
response = client.fim.completion(
    model="codestral-latest",
    prompt="def fibonacci(n):\n    if n <= 1:\n        return n\n    ",
    suffix="\n\nprint(fibonacci(10))"
)

向いているケース: VS Code等のIDE拡張で、カーソル位置の前後を渡してインライン補完するパターン。

避けるべきケース: 自然言語による要件記述からゼロイチで作る生成タスクには不向き。普通のchat.completeを使う。

パターンB: Ollamaでローカル実行

# ローカル環境でCodestralを動かす
ollama pull codestral
ollama run codestral "Reactのカスタムフックでデバウンスを実装して"

向いているケース: 機密コードを外部に送れない環境、オフライン開発、社内クローズドネットワーク。

避けるべきケース: 軽量なノートPCのみの環境。22Bモデルの量子化版でも16GB以上のVRAM/RAMが現実的に必要です。

アンチパターン: 機密データを公式APIに直接送る

# NG: 業務コードや機密設定値をそのままAPIに送らない
client.chat.complete(
    model="codestral-latest",
    messages=[{"role":"user","content": SECRETS_FILE_CONTENT}]
)

Codestralの非製品ライセンスやAPI利用規約を確認せず、機密データをそのまま送るのは典型的な事故パターンです。機密性の高い案件ではローカル実行（Ollama / vLLM）またはMistralのオンプレミス契約を選ぶ必要があります。

Codestralのメリット・デメリット

メリット

コーディング特化の精度: 汎用LLMより少ないパラメータで同等以上のコード生成性能。
FIM対応: IDE補完体験が滑らか。
256K文脈窓: 中規模リポジトリ全体を読み込める。
オープンウェイト: Hugging Faceから重みをダウンロードしてローカル実行が可能。
コスト効率: 22BクラスはGPT-4より遥かに低コストで動かせる。

デメリット

ライセンス制約: Mistral AI Non-Production License下で、商用利用には別契約が必要な場合がある。
日本語UI言語の知識は弱め: 英語中心の学習データのため、日本語コメントの自然さで劣る場面がある。
専用ハード必要: ローカル実行には16GB以上のVRAM・RAMが現実的に必要。
Mistralエコシステム依存: 新機能はMistralのリリーススケジュールに依存する。

CodestralとGitHub Copilot・GPT-4・Claudeの違い

Codestralは「コーディング特化のオープンウェイトLLM」という位置づけで、GitHub CopilotやGPT-4、Claudeと用途が重なる。下記の比較表で違いを整理する。

観点	Codestral	GitHub Copilot	GPT-4 / Claude
ホスティング	クラウドAPI / ローカル / オンプレミス	クラウドのみ	クラウドのみ（一部Bedrock経由）
特化度	コード特化	コード特化（バックエンドはGPT-4o系）	汎用
パラメータ数	22B	非公開（推定数百B級）	非公開（巨大）
文脈窓	256K（v25.01以降）	128K前後	128K〜200K
FIM対応	○（最適化済み）	○（裏のモデルに依存）	△（汎用LLMで代替）
向いている用途	機密コードのローカル補完	一般開発者の日常補完	設計・要件定義・自然言語ベースの開発

つまり「Codestralは『コードに特化』『オープンウェイト』『ローカル実行可』という3点が強み」と覚えれば整理しやすい。実務では、GitHub Copilot＋Codestral＋Claudeを役割分担して併用する企業も増えています。

よくある誤解

誤解1: 「Codestralは商用利用フリー」

なぜそう誤解されるのか: 「オープンウェイト」と「商用利用フリー」が同義に語られる風潮があることが理由。Hugging Faceで重みがダウンロードできる事実から、Apache 2.0やMITに近いライセンスを連想してしまう開発者も多い。

正しい理解: Codestralは「Mistral AI Non-Production License」で配布されており、研究・テスト用途が中心。商用利用にはMistral社との別契約が必要な場合があります。実装前にライセンス条項を必ず確認する必要があります。

誤解2: 「CodestralはGitHub Copilotの完全代替になる」

なぜそう誤解されるのか: コード特化LLMという共通点と、HumanEval等のベンチマークで高スコアを出していることから、機能面でも互換だと思われがち。しかし両者の役割範囲は微妙に異なるという背景がある。

正しい理解: Codestralは「モデル」、GitHub Copilotは「IDE統合プロダクト」。Copilotにはコードレビュー・PR説明生成・チャット等のプロダクト機能がパッケージ化されているため、Codestralを単に置き換えるとIDE体験面で機能不足になる場面もあります。Codestralを使うなら別途IDE拡張が必要です。