氏名突合支援サービス
概要
公開日
氏名突合支援サービスとは
デジタル庁が提供する氏名の「漢字・アルファベット」と「カナ」を突合・推定する業務を支援するためのAPI等を提供するサービスです。
提供コンテンツ
氏名突合支援サービスにて提供するコンテンツは次の通りです。
いずれの利用に際しても「利用規約」及び「プライバシーポリシー」をご確認いただき、規約に同意の上でご利用ください。
| コンテンツ | 提供場所 | |
|---|---|---|
| 氏名漢字カナ突合API | 利用方法 | 氏名突合支援サービスサポートサイト(クイックスタート) |
| APIキー管理 | 氏名突合支援サービスサポートサイト(APIキー管理ページ) | |
| 利用サンプルプログラム・Excelツール | デジタル庁 GitHub(kanjikana-api-sample) 氏名突合支援サービスサポートサイト(デモ) | |
| 氏名漢字カナ突合モデル | 利用方法・詳細仕様 | 氏名突合支援サービスサポートサイト |
| ソースコード | デジタル庁 GitHub(kanjikana-model) | |
| 辞書データ・AIモデル | 氏名突合支援サービスサポートサイト(リソース) |
利用・展開のイメージ
氏名突合支援サービスの中核機能である「氏名漢字カナ突合API」は、お手持ちのメールアドレスでアカウント登録後、すぐに氏名漢字カナ突合API(デジタル庁提供方式)の利用が可能です。
ネットワーク環境の制限などにより、デジタル庁が提供するサービスをインターネット経由で直接利用できなかったり、デジタル庁による制限なく自由に利用したい場合のため「セルフホスティング方式」に必要となるコンテンツの提供もしております。セルフホスティング方式にて必要となるソースコード等は、デジタル庁が管理する「デジタル庁 GitHub(kanjikana-model)」にて配布しています。
各種詳細な仕様については「氏名突合支援サービスサポートサイト」を参照ください。
想定されるユースケース
本サービスを利用する業務のユースケースとしては次のようなものを想定しています。
あくまで想定であり、以下ユースケース以外での利用を妨げるものではありません。
突合作業に際し、「氏」と「名」の両方は必須ではなく、「氏だけ」「名だけ」での利用も可能です。
データ内の氏名の整合性確認
人手により入力されたデータ(自由入力可能な電子入力フォームデータや手書き書類をOCR等にて電子化したもの)の氏名・カナの整合性チェックするような業務での利用が想定されます。
源泉が異なるデータ間の氏名とカナでの照合
データ(漢字氏名、カナ氏名をそれぞれ含むデータ)間の名寄せ、自治体での給付業務における漢字氏名と振込先口座名義人(=カナ氏名)の突合作業などでの利用が想定されます。
氏名突合支援サービスの仕様
APIのリクエストパラメータやレスポンスの詳細については「氏名漢字カナ突合API」のページを参照してください。
提供するAPI機能
「氏名漢字カナ突合API」では以下4つの機能を提供しています。
| 機能 | やりたいこと | |
|---|---|---|
| 氏名突合 | 簡易突合(simple) | 「漢字・アルファベット氏名」と「カナ氏名」の組合せの正確性をスピーディに確認したい |
| 詳細突合(detail) | 「漢字・アルファベット氏名」と「カナ氏名」の組合せの正確性をより多くの情報に基づき確認したい | |
| 氏名推定 | 漢字→カナ推定(kanji) | 「漢字・アルファベット氏名」から「カナ氏名」の候補を取得したい |
| カナ→漢字推定(kana) | 「カナ氏名」から「漢字・アルファベット氏名」の候補を取得したい |
APIで入力として許容される氏名の形式
標準形式
「氏名」の場合には、スペース(全角・半角問わず)で区切って入力してください。「氏のみ」や「名のみ」でも入力可能です。
また、「氏名」にアルファベット(全角・半角問わず)を含めることも可能です。
「カナ」はカタカナでの入力を基本としていますが、ひらがなでの入力も可能です。
| 形式 | 氏名(kanji) | カナ(kana) | |
|---|---|---|---|
| 基本形 | 氏名 | 日本 花子 | ニホン ハナコ |
| 氏だけ | 日本 | ニホン | |
| 名だけ | 花子 | ハナコ | |
| ひらがな | 氏名 | 日本 花子 | にほん はなこ |
| 氏だけ | 日本 | にほん | |
| 名だけ | 花子 | はなこ | |
| アルファベット(全角) | 氏名 | NIPPON HANAKO | ニッポン ハナコ |
| 氏だけ | NIPPON | ニッポン | |
| 名だけ | HANAKO | ハナコ | |
| アルファベット(半角) | 氏名 | NIPPON HANAKO | ニッポン ハナコ |
| 氏だけ | NIPPON | ニッポン | |
| 名だけ | HANAKO | ハナコ |
マイナンバーカード(券面)の氏名形式
マイナンバーカード(券面)の氏名に準拠した形式の文字列を入力として受け付けられるように構成されています。
| 形式 | 氏名(kanji) | カナ(kana) |
|---|---|---|
| 漢字氏名 | 日本 花子 | ニッポン ハナコ |
| 漢字氏名+旧氏 | 日本 [東京] 花子 | ニッポン ハナコ トウキョウ ハナコ |
| アルファベット氏名 | NIPPON HANAKO | ニッポン ハナコ |
| NIPPON JAPAN HANAKO | ニッポン ジャパン ハナコ | |
| HANAKO JAPAN NIPPON | ニッポン ジャパン ハナコ | |
| アルファベット氏名+漢字氏名 | NIPPON JAPAN HANAKO_日本 花子 | ニッポン ハナコ ニッポン ジャパン ハナコ |
| アルファベット氏名+漢字氏名+通称 | NIPPON JAPAN HANAKO_日本 花子(東京 花子) | ニッポン ハナコ ニッポン ジャパン ハナコ トウキョウ ハナコ |
簡易突合(simple)及び詳細突合(detail)の動作
入力として受け付けた「漢字(kanji)」と「カナ(kana)」に対し、各種マッチング処理を行い、判定結果をスコア(0から99までの値で、高いほど正しい可能性が高いことを示す。)で返却します。
返却するスコアとその意味は以下の通りです。返却スコアパターンは今後変更される可能性があります。詳細は「氏名突合支援サービスサポートサイト」を参照ください。
「50」をしきい値として、50以上を正、50未満(49以下)を誤として判定いただくことを推奨しています。
氏名推定(漢字・アルファベット⇔カナ)の動作
入力として受け付けた「漢字・アルファベット」・「カナ」に対応する、正解である可能性が高い「カナ」・「漢字」を返却します。
マッチング手法の概要
氏名漢字カナ突合モデルで用いているマッチング手法としては下記4種類があり、組み合わせてマッチングをしています。
詳細は「氏名突合支援サービスサポートサイト」にて説明しています。
辞書マッチング
辞書にある読み方がどうかを判断し、一致・不一致を判定しています。
統計マッチング
漢字氏名とカナ氏名のペアの出現頻度(回数)と設定したしきい値に基づき、一致・不一致の判定をしています。
※注:一般公開している氏名漢字カナ突合APIでのマッチング判定においては、統計マッチングによる判定はしていません。
外国人名マッチング
名古屋大学の佐藤理史先生の研究成果であるアルゴリズム・システムを活用し、一致・不一致の判定をしています。
詳細は「2020東京オリンピック参加者名簿の翻訳(佐藤 理史、自然言語処理 Vol. 30 No. 2)」を参照ください。
AI推論マッチング
学習用辞書からAIエンジンを用いて生成したAIモデルを用いて、一致・不一致の判定しています。