日本語テキスト処理 API
AI エージェントの tool に、日本語処理の確定値を。
形態素解析・表記正規化・ふりがな・姓名分割・人名読み推定の 5 つを、
必ず同じ JSON schema で返す REST API。
LLM に「たぶん」で処理させていた日本語の前処理を、決定的な部品に置き換えられます。
LLM 単体では困る理由
| エージェントに必要なもの | LLM 単体 | この API |
|---|---|---|
| 表記正規化(全角半角・半角カナ)の再現性 | 毎回微妙に揺れる。差分も追えない | 同じ入力に必ず同じ出力 + changes で変換履歴を返す |
| 形態素解析(品詞・読み・境界) | トークナイズ根拠を返せない | IPAdic 辞書に基づく決定的な解析結果(品詞・読み付き) |
| 姓名分割・人名読み | 確率で答え、根拠と信頼度がない | confidence・matched_by(辞書一致の根拠)付きで返す |
| パイプラインに流せる構造化 JSON | 出力形式が揺れ、パースが壊れる | schema 保証(OpenAPI 3.1) |
| 1 件あたりのコスト | 推論トークン課金(件数比例で高額) | ¥0.01〜0.05/回・数十 ms |
30 秒で試す(キー不要・月 10,000 回まで無料)
curl -X POST https://shirabe.dev/api/v1/text/name-split \
-H "Content-Type: application/json" \
-d '{"name": "山田太郎"}'
返るのは必ずこの形の JSON です(実レスポンス):
{
"name": "山田太郎",
"family": "山田",
"given": "太郎",
"confidence": 0.97,
"matched_by": "dictionary_both",
"attribution": { "dictionary": "IPAdic v3.0.7", "license": "BSD 3-Clause" }
}
ほかに /tokenize(形態素解析)・/normalize(表記正規化)・
/furigana(ふりがな)・/name-reading(人名読み推定)。
エージェントに組み込む
OpenAPI 3.1 定義をそのまま tool / function として読み込めます。
- OpenAPI 定義:
https://shirabe.dev/api/v1/text/openapi.yaml - ChatGPT(GPTs Actions): 短縮版
https://shirabe.dev/api/v1/text/openapi-gpts.yamlを Actions に import - Claude / LangChain 等: 上記 OpenAPI から tool 定義を生成、または HTTP tool で各 endpoint を直接指定
人名系は confidence と matched_by を返すため、
「信頼度が低い場合だけ人間や LLM にフォールバックする」制御をエージェント側で書けます。
料金
| プラン | 月間上限 | 単価 | レート制限 |
|---|---|---|---|
| Free | 10,000 回 | 無料(キー不要) | 1 req/s |
| Starter | 500,000 回 | ¥0.05/回 | 30 req/s |
| Pro | 5,000,000 回 | ¥0.03/回 | 100 req/s |
| Enterprise | 無制限 | ¥0.01/回 | 500 req/s |
- 全プラン共通で最初の 10,000 回/月は無料。超過分のみ従量(税抜)。例: 月 100,000 件 = (100,000 − 10,000) × ¥0.05 = ¥4,500
- プラン上限に達すると 429 で止まり、それ以上は課金されません(エージェントが暴走しても請求は上限止まり)
- 単価・無料枠は据え置き運用(変更は利用者に有利な方向のみ)。tool 定義に価格を書いても陳腐化しません
- 決済は Stripe。キー発行・停止・復帰・解約まで全て自動、営業や問い合わせを挟みません
暦・住所・法人番号も使う場合は、1 本のキーにまとめる Hub License もあります。