Pinecone（パインコーン）とは？読み方・サーバーレス v2 ベクトルDBの仕組み・RAG活用・Qdrantとの違いを完全解説

Q: Pineconeは無料で使えますか？

無料枠 Starter Plan が用意されており、小規模な検証や個人開発であれば無料で試せます。本格運用ではStandard/Enterpriseプランへ移行し、Read/Write/Storage単位の従量課金になります。実務では予算の見積もりは Read 主体になることが多い点を覚えておきましょう。

Q: Pineconeでメタデータフィルタはどこまで使えますか？

完全一致、不等式、配列のin/nin、論理演算 and/or に対応しています。

Q: PineconeのSLAやデータ保護は？

Standard以上のプランで稼働率SLAと暗号化・SOC 2対応が提供されます。

Pinecone（パインコーン）とは、AI／RAG向けに設計されたフルマネージドのベクトルデータベースサービスのこと。2019年創業、ニューヨーク拠点。検索拡張生成（RAG）、レコメンデーション、セマンティック検索、エージェントの記憶基盤などで広く採用されている。2024年以降はサーバーレス型に主軸を移し、2026年にはサーバーレス v2 へとアップデートされた。

例えるなら、Pineconeは「意味で検索するためのデータベース」。一般的なRDBMSが文字や数値の完全一致で探すのに対し、Pineconeはベクトル（数百〜数千次元の数値の組）で「似ているもの」を高速に探す。実務ではOpenAI・Cohere・Anthropicなどの埋め込みモデルと組み合わせて、社内文書検索やAIエージェントの長期記憶として使われています。実務では選定の起点としてまず最初に検討されることが多いツールです。

Pineconeとは

Pineconeとは、埋め込みベクトルを保存・検索するためのクラウド型ベクトルデータベースである。AWSやGCPのリージョン上で動作し、ユーザーは「インデックス」を作成してそこにベクトルとメタデータを書き込み、類似検索クエリを実行する。インフラの管理（シャーディング、レプリケーション、再平衡化）はPinecone側が透過的に行うため、利用者はAI機能の実装に集中できる。

2024年に「Serverless」アーキテクチャを正式公開し、従来のpod型インデックスはレガシー扱いに移行。Q1 2026には「Serverless v2」がリリースされ、低レイテンシ化とコスト効率の改善、レコメンデーション・エージェント用途への自動最適化が追加された。ここが重要なポイントです。「Pineconeは古いpod型」という情報のままだと最新動向を見落とす場面があります。

Pineconeの読み方

パインコーン

パインコン（短縮）

パインコーンディービー（古い表記）

Pineconeの仕組み

Pineconeは「インデックス → upsert → query」の流れで使う典型的なベクトルDBである。サーバーレス v2 ではバックエンドが自動的にワークロードに応じてシャードを割り当てるため、ユーザーはキャパシティ計画を意識する必要がない。料金は「Read Unit（読み取り）」「Write Unit（書き込み）」「Storage（保存量）」の3軸で計算される。

PineconeのRAGパイプライン

埋め込みモデル
(OpenAI / Cohere / 自前)

→

Pinecone
(ベクトル保存・近似最近傍検索)

→

LLM
(Claude / GPT-5 / Command R+)

主要概念

Index — ベクトルとメタデータの集合。次元数と類似度メトリック（cosine / dot / L2）を作成時に指定する。
Namespace — インデックス内の論理的な区切り。マルチテナント運用に便利。
Vector — id・値（floatの配列）・メタデータ（任意のJSON）の3要素。
Upsert — 既存ベクトルの更新と新規追加を兼ねる書き込み操作。
Query — クエリベクトルから近い順にtop_k件を取得する操作。
Filter — メタデータ条件で結果を絞り込むための機能。

歴史

創業者のEdo Liberty氏はAWSのAI Labsを率いた経歴を持ち、2019年にPineconeを設立。2023年のRAGブームに乗って急成長し、2024年にはServerlessアーキテクチャの本格展開、2026年にはServerless v2のリリースに至っている。バージョンアップの背景には「pod型では立ち上げ・運用コストが高すぎる」という顧客フィードバックがあったとされる。

Pineconeの使い方・実例

基本的な使い方（Quick Start）

# Python公式SDKで Serverless インデックスを作成し vector を upsert
from pinecone import Pinecone, ServerlessSpec

pc = Pinecone(api_key="YOUR_KEY")
pc.create_index(
    name="docs",
    dimension=1536,
    metric="cosine",
    spec=ServerlessSpec(cloud="aws", region="us-east-1"),
)
index = pc.Index("docs")
index.upsert([
    {"id": "doc-1", "values": [0.1]*1536, "metadata": {"title": "API設計の基本"}},
])
res = index.query(vector=[0.1]*1536, top_k=3, include_metadata=True)
print(res.matches)

よくある実装パターン

パターンA: RAGの記憶ストア

# 検索結果を取り出してLLMにcontextとして渡す
matches = index.query(vector=embed(question), top_k=5, include_metadata=True)
context = "\n\n".join(m.metadata["text"] for m in matches.matches)
answer = llm.generate(question, context=context)

向いているケース: 社内ドキュメントQAボット、カスタマーサポート、リーガル検索など、外部データを参照して回答するLLMアプリ全般。実務では最も需要の多い使い方です。

避けるべきケース: トラフィックが極端に低くRAGの恩恵が薄い場合。ローカルのSQLite + sqlite-vss などで充足するケースもある。

パターンB: メタデータフィルタつきセマンティック検索

# 「2024年以降の法務文書」だけに絞り込んで検索
index.query(
    vector=q_vec, top_k=10,
    filter={"category": {"$eq": "legal"}, "year": {"$gte": 2024}},
)

向いているケース: 大量の文書を扱う企業検索、Eコマースの属性絞り込み付きレコメンドなど。フィルタを使うことで結果のノイズを大幅に削減できます。

避けるべきケース: 1ベクトル毎にメタデータが巨大な構造化データを格納する用途。Pineconeはメタデータサイズに上限があり、大容量メタデータ管理には別途RDBMSとの併用が推奨されます。

パターンC: Hybrid Search（疎ベクトル＋密ベクトル）

# 疎（BM25系）と密（embedding）を同時に投げて両方のスコアで合算
index.query(
    vector=dense_vec,
    sparse_vector={"indices": [...], "values": [...]},
    top_k=10,
)

向いているケース: 完全一致と意味的類似の両方を重視するエンタープライズ検索。製品名・型番が頻出する場面で特に効果が高い。

アンチパターン: 次元の異なる埋め込みを同じインデックスに混在

# 絶対NG
# 1536次元（OpenAI text-embedding-3-small）と
# 1024次元（Cohere Embed v3）を同じindexに入れることは不可能

インデックス作成時に決めた次元数は変更不能。モデルを切り替える際は新インデックスを作成し、全文書を再埋め込みして移行する必要があります。実務では「ブルーグリーンインデックス」運用で乗り切るのが定石です。

Pineconeのメリット・デメリット

メリット

マネージド — シャーディング・レプリカ・スケーリングを意識不要
低レイテンシ — 数億ベクトル規模でもp99で数十ミリ秒
サーバーレス課金 — 待機料金ゼロ。バースト型ワークロードに有利
主要LLMフレームワークと統合 — LangChain, LlamaIndex, Anthropic SDK等
Hybrid Search対応 — 疎+密ベクトル両対応

デメリット・注意点

ベンダーロックイン — 独自API。OSS互換ではない
料金が複雑 — Read/Write/Storageの3軸で見積もりが必要
大容量メタデータ非推奨 — 巨大なJSONはRDBMS側に分離
次元数を後から変更不可 — モデル切替時は再インデックス必須

PineconeとQdrant・Weaviateの違い

Pineconeはしばしば「Qdrant」「Weaviate」と並べて比較される。3社とも「マネージドベクトルDB」を提供するが、価格モデル、OSS有無、機能設計に違いがある。

観点	Pinecone	Qdrant	Weaviate
提供形態	フルマネージドのみ	OSS＋マネージド	OSS＋マネージド
課金モデル	Read/Write/Storage従量	クラスタ単位	クラスタ単位
セルフホスト	不可	可能	可能
Hybrid検索	対応（疎＋密）	対応	対応（GraphQL経由）
特徴	サーバーレスの完成度	Rust製で高速	スキーマ駆動・モジュール

つまり「Pinecone＝マネージド最強・運用ラク、Qdrant＝OSSも選択可・Rust性能、Weaviate＝GraphQL・モジュール豊富」と整理できる。

Pineconeに関するよくある誤解

誤解1: 「Pineconeはpod型クラスタを契約するもの」

なぜそう誤解されるのか: 2023年以前の解説記事や書籍がpod型を前提に書かれており、いまだネット上にその情報が残存しているため。バージョンアップが起きると古い記事の混入で初学者が混乱する背景がある。

正しい理解: 2024年以降サーバーレスがデフォルトとなり、2026年にはServerless v2へ更新された。pod型はレガシー扱いで、新規プロジェクトでは原則サーバーレス選択を推奨されています。

誤解2: 「Pineconeは1社1インデックスで使うもの」

なぜそう誤解されるのか: 多くのチュートリアルが単一インデックスでの利用例を扱うため、複数インデックスの活用方法が見えにくい。さらに「Namespace」概念が後発で追加された経緯がある。

正しい理解: マルチテナントSaaSではNamespaceで顧客ごとに区切るのが定石。組織全体で複数インデックス＋複数Namespaceを併用するのは普通の構成です。

誤解3: 「PineconeはOSSなのでセルフホストできる」

なぜそう誤解されるのか: 「ベクトルDB＝OSS」という業界全体のイメージから、PineconeもOSSと混同される背景がある。Qdrant・WeaviateがOSSであることも背景にある。

正しい理解: PineconeはマネージドSaaSのみで、ソースコードは非公開・セルフホスト不可。OSSが要件なら QdrantやWeaviate、Milvus、Chromaなどを選ぶことになります。

Pineconeの実務での活用シーン

社内ドキュメントQAボット — 技術文書・規程をRAGで検索＋回答
カスタマーサポート支援 — 過去問合せから類似ケースを推薦
Eコマースのレコメンド — 行動ベクトルから類似商品を提示
AIエージェントの長期記憶 — 会話履歴を埋め込みで保存
異常検知 — 既知の正常パターンとの距離を測る
医療・法務リサーチ — 数億件の論文・判例から類似事例を検索

Pineconeに関するよくある質問（FAQ）

Q1. Pineconeは無料で使えますか？

無料枠（Starter Plan）が用意されており、小規模な検証や個人開発であれば無料で試せます。本格運用ではStandard / Enterpriseプランへ移行し、Read/Write/Storage単位の従量課金になります。実務では予算の見積もりは Read 主体になることが多い点を覚えておきましょう。

Q2. PineconeとPostgres + pgvectorはどちらが良いですか？

数百万ベクトル以下、既存のPostgres運用がある場合はpgvectorで十分なケースが多いです。数千万〜数億規模、低レイテンシを重視する場面ではPineconeのマネージド運用が圧倒的に楽になります。

Q3. 次元数が異なる埋め込みモデルに切り替えたいときは？

既存インデックスの次元数は変更できないため、新インデックスを作成して全文書を再埋め込みします。本番運用では旧インデックス・新インデックスを同時稼働させ、切り替え後に旧を削除する「ブルーグリーン方式」が一般的です。

Q4. Pineconeでメタデータフィルタはどこまで使えますか？

完全一致、不等式、配列のin / nin、論理演算（and / or）に対応しています。ただしメタデータサイズには上限があるため、巨大なJSONを保存する用途は別DBへの分離が推奨されます。

Q5. PineconeのSLAやデータ保護は？

Standard以上のプランで稼働率SLA（典型的には99.95%）と暗号化・SOC 2対応が提供されます。詳細はPineconeの公式セキュリティページで確認するのが確実です。