From shinkoku
Extracts structured data from Japanese payment statement images/PDFs via text extraction, OCR, and dual verification. Outputs payer name, category, gross/withholding amounts.
npx claudepluginhub kazukinagata/shinkoku --plugin shinkokuThis skill uses the workspace's default tool permissions.
支払調書(報酬、料金、契約金及び賞金の支払調書)の画像を読み取り、構造化データとして返すスキル。
Extracts structured financial data from Japanese withholding tax slip images or PDFs using OCR, dual verification, and text extraction for accuracy.
Parses financial statement PDFs (checking, savings, credit card, brokerage, 401k, HSA, mortgage, tax forms) into normalized JSON with institution, account mask, period, balances, transactions or holdings, and confidence score.
Extracts invoice data from images or text descriptions, auto-classifies into categories like business entertainment and travel, and generates Excel expense reports for reimbursement.
Share bugs, ideas, or general feedback.
支払調書(報酬、料金、契約金及び賞金の支払調書)の画像を読み取り、構造化データとして返すスキル。
ファイルが PDF(.pdf)の場合、画像 OCR の前にテキスト抽出を試みる。
shinkoku pdf extract-text --file-path <path> を実行するshinkoku pdf to-image --file-path <path> --output-dir <dir> で PNG に変換し、以下の画像読み取りフローに進む精度を高めるため、同じ画像を2つの独立したコンテキストで並列に読み取り、結果を照合する。
2つの独立した読み取りを実行する: サブエージェントが使える環境では、2つのサブエージェントを並列で起動し、それぞれ独立に画像を読み取る。 各サブエージェントには以下の「基本ルール」と「出力フォーマット」をプロンプトとして渡し、画像ファイルパスを指定する。
結果照合: 両方の読み取り結果から主要フィールド(金額等)を比較する。
一致の場合: そのまま採用。「2つの独立した読み取りで結果が一致しました」と報告する。
不一致の場合: ユーザーに元画像パスと両方の結果を提示し、正しい方を選択してもらう:
サブエージェントが利用できない環境では、以下の手順で読み取る:
⚠ デュアル検証が利用できないため、必ずユーザーに目視確認を依頼してください。
画像を読み取り、以下の形式で返す:
---PAYMENT_STATEMENT_DATA---
payer_name: 支払者名
category: 区分(報酬/料金/契約金/賞金)
gross_amount: 支払金額(int)
withholding_tax: 源泉徴収税額(int)
---END---
複数のファイルパスが指示された場合:
## file1.jpg
---PAYMENT_STATEMENT_DATA---
...
---END---
## file2.jpg
---PAYMENT_STATEMENT_DATA---
...
---END---