From shinkoku
Extracts structured data from Japanese receipt, bill, and furusato nozei proof images/PDFs via OCR, PDF text extraction, and dual-agent validation.
npx claudepluginhub kazukinagata/shinkoku --plugin shinkokuThis skill uses the workspace's default tool permissions.
レシート・領収書・ふるさと納税受領証明書の画像を読み取り、構造化データとして返すスキル。
Extracts structured data from Japanese invoice images/PDFs using OCR, dual verification, and PDF text extraction. Outputs vendor, amounts, date, items in fixed format.
Parses financial statement PDFs (checking, savings, credit card, brokerage, 401k, HSA, mortgage, tax forms) into normalized JSON with institution, account mask, period, balances, transactions or holdings, and confidence score.
Extracts invoice data from images or text descriptions, auto-classifies into categories like business entertainment and travel, and generates Excel expense reports for reimbursement.
Share bugs, ideas, or general feedback.
レシート・領収書・ふるさと納税受領証明書の画像を読み取り、構造化データとして返すスキル。
ファイルが PDF(.pdf)の場合、画像 OCR の前にテキスト抽出を試みる。
shinkoku pdf extract-text --file-path <path> を実行するshinkoku pdf to-image --file-path <path> --output-dir <dir> で PNG に変換し、以下の画像読み取りフローに進む精度を高めるため、同じ画像を2つの独立したコンテキストで並列に読み取り、結果を照合する。
2つの独立した読み取りを実行する: サブエージェントが使える環境では、2つのサブエージェントを並列で起動し、それぞれ独立に画像を読み取る。 各サブエージェントには以下の「基本ルール」と「出力フォーマット」をプロンプトとして渡し、画像ファイルパスを指定する。
結果照合: 両方の読み取り結果から主要フィールド(金額等)を比較する。
一致の場合: そのまま採用。「2つの独立した読み取りで結果が一致しました」と報告する。
不一致の場合: ユーザーに元画像パスと両方の結果を提示し、正しい方を選択してもらう:
サブエージェントが利用できない環境では、以下の手順で読み取る:
⚠ デュアル検証が利用できないため、必ずユーザーに目視確認を依頼してください。
画像を読み取り、以下の形式で返す:
---RECEIPT_DATA---
date: YYYY-MM-DD
vendor: 店舗名
total_amount: 金額(int)
tax_included: true/false
items:
- name: 品目名
amount: 金額(int)
quantity: 数量(int)
---END---
画像を読み取り、以下の形式で返す:
---FURUSATO_RECEIPT_DATA---
municipality_name: 自治体名(市区町村名)
prefecture: 都道府県名
amount: 寄附金額(int)
date: YYYY-MM-DD
receipt_number: 受領証明書番号(記載がなければ UNKNOWN)
---END---
複数のファイルパスが指示された場合、または Glob パターンでファイル一覧を取得した場合:
## file1.jpg
---RECEIPT_DATA---
...
---END---
## file2.jpg
---RECEIPT_DATA---
...
---END---