日本語テキスト処理 API

AI エージェントの tool に、日本語処理の確定値を。

形態素解析・表記正規化・ふりがな・姓名分割・人名読み推定の 5 つを、 必ず同じ JSON schema で返す REST API。
LLM に「たぶん」で処理させていた日本語の前処理を、決定的な部品に置き換えられます。

申し込む(月 10,000 回まで無料)

LLM 単体では困る理由

エージェントに必要なものLLM 単体この API
表記正規化(全角半角・半角カナ)の再現性 毎回微妙に揺れる。差分も追えない 同じ入力に必ず同じ出力 + changes で変換履歴を返す
形態素解析(品詞・読み・境界) トークナイズ根拠を返せない IPAdic 辞書に基づく決定的な解析結果(品詞・読み付き)
姓名分割・人名読み 確率で答え、根拠と信頼度がない confidencematched_by(辞書一致の根拠)付きで返す
パイプラインに流せる構造化 JSON 出力形式が揺れ、パースが壊れる schema 保証(OpenAPI 3.1)
1 件あたりのコスト 推論トークン課金(件数比例で高額) ¥0.01〜0.05/回・数十 ms

30 秒で試す(キー不要・月 10,000 回まで無料)

curl -X POST https://shirabe.dev/api/v1/text/name-split \
  -H "Content-Type: application/json" \
  -d '{"name": "山田太郎"}'

返るのは必ずこの形の JSON です(実レスポンス):

{
  "name": "山田太郎",
  "family": "山田",
  "given": "太郎",
  "confidence": 0.97,
  "matched_by": "dictionary_both",
  "attribution": { "dictionary": "IPAdic v3.0.7", "license": "BSD 3-Clause" }
}

ほかに /tokenize(形態素解析)・/normalize(表記正規化)・ /furigana(ふりがな)・/name-reading(人名読み推定)。

エージェントに組み込む

OpenAPI 3.1 定義をそのまま tool / function として読み込めます。

  • OpenAPI 定義: https://shirabe.dev/api/v1/text/openapi.yaml
  • ChatGPT(GPTs Actions): 短縮版 https://shirabe.dev/api/v1/text/openapi-gpts.yaml を Actions に import
  • Claude / LangChain 等: 上記 OpenAPI から tool 定義を生成、または HTTP tool で各 endpoint を直接指定

人名系は confidencematched_by を返すため、 「信頼度が低い場合だけ人間や LLM にフォールバックする」制御をエージェント側で書けます。

→ 技術ドキュメント(全 5 endpoint 仕様・エラー・レート制限)

料金

プラン月間上限単価レート制限
Free10,000 回無料(キー不要)1 req/s
Starter500,000 回¥0.05/回30 req/s
Pro5,000,000 回¥0.03/回100 req/s
Enterprise無制限¥0.01/回500 req/s
  • 全プラン共通で最初の 10,000 回/月は無料。超過分のみ従量(税抜)。例: 月 100,000 件 = (100,000 − 10,000) × ¥0.05 = ¥4,500
  • プラン上限に達すると 429 で止まり、それ以上は課金されません(エージェントが暴走しても請求は上限止まり)
  • 単価・無料枠は据え置き運用(変更は利用者に有利な方向のみ)。tool 定義に価格を書いても陳腐化しません
  • 決済は Stripe。キー発行・停止・復帰・解約まで全て自動、営業や問い合わせを挟みません

申し込む →

暦・住所・法人番号も使う場合は、1 本のキーにまとめる Hub License もあります。