日本語テキスト処理 API

AI エージェントの tool に、日本語処理の確定値を。

形態素解析・表記正規化・ふりがな・姓名分割・人名読み推定の 5 つを、必ず同じ JSON schema で返す REST API。
LLM に「たぶん」で処理させていた日本語の前処理を、決定的な部品に置き換えられます。

LLM 単体では困る理由

エージェントに必要なもの	LLM 単体	この API
表記正規化(全角半角・半角カナ)の再現性	毎回微妙に揺れる。差分も追えない	同じ入力に必ず同じ出力 + `changes` で変換履歴を返す
形態素解析(品詞・読み・境界)	トークナイズ根拠を返せない	IPAdic 辞書に基づく決定的な解析結果(品詞・読み付き)
姓名分割・人名読み	確率で答え、根拠と信頼度がない	`confidence`・`matched_by`(辞書一致の根拠)付きで返す
パイプラインに流せる構造化 JSON	出力形式が揺れ、パースが壊れる	schema 保証(OpenAPI 3.1)
1 件あたりのコスト	推論トークン課金(件数比例で高額)	¥0.01〜0.05/回・数十 ms

30 秒で試す(キー不要・月 10,000 回まで無料)

curl -X POST https://shirabe.dev/api/v1/text/name-split \
  -H "Content-Type: application/json" \
  -d '{"name": "山田太郎"}'

返るのは必ずこの形の JSON です(実レスポンス):

{
  "name": "山田太郎",
  "family": "山田",
  "given": "太郎",
  "confidence": 0.97,
  "matched_by": "dictionary_both",
  "attribution": { "dictionary": "IPAdic v3.0.7", "license": "BSD 3-Clause" }
}

ほかに /tokenize(形態素解析)・/normalize(表記正規化)・ /furigana(ふりがな)・/name-reading(人名読み推定)。

エージェントに組み込む

OpenAPI 3.1 定義をそのまま tool / function として読み込めます。

OpenAPI 定義: https://shirabe.dev/api/v1/text/openapi.yaml
ChatGPT(GPTs Actions): 短縮版 https://shirabe.dev/api/v1/text/openapi-gpts.yaml を Actions に import
Claude / LangChain 等: 上記 OpenAPI から tool 定義を生成、または HTTP tool で各 endpoint を直接指定

人名系は confidence と matched_by を返すため、「信頼度が低い場合だけ人間や LLM にフォールバックする」制御をエージェント側で書けます。

→ 技術ドキュメント(全 5 endpoint 仕様・エラー・レート制限)

料金

プラン	月間上限	単価	レート制限
Free	10,000 回	無料(キー不要)	1 req/s
Starter	500,000 回	¥0.05/回	30 req/s
Pro	5,000,000 回	¥0.03/回	100 req/s
Enterprise	無制限	¥0.01/回	500 req/s

全プラン共通で最初の 10,000 回/月は無料。超過分のみ従量(税抜)。例: 月 100,000 件 = (100,000 − 10,000) × ¥0.05 = ¥4,500
プラン上限に達すると 429 で止まり、それ以上は課金されません(エージェントが暴走しても請求は上限止まり)
単価・無料枠は据え置き運用(変更は利用者に有利な方向のみ)。tool 定義に価格を書いても陳腐化しません
決済は Stripe。キー発行・停止・復帰・解約まで全て自動、営業や問い合わせを挟みません

申し込む →

暦・住所・法人番号も使う場合は、1 本のキーにまとめる Hub License もあります。