【ガイド】AI に決算短信 PDF を読ませる時の数字捏造を防ぐ 7 つの注意点 — Claude / ChatGPT 運用ルール
なぜ「数字捏造」が AI 利用最大のリスクか
決算分析・市場ニュース記事における 唯一の絶対的な失格条件は「数字を間違えること」。文章が硬くても、構造が美しくなくても、読者は許してくれる。しかし「営業利益 500 億円」と書いた数字が実は 300 億円だった瞬間、サイト全体の信頼が崩れる。
AI(Claude / ChatGPT 等)の最大の落とし穴は、「もっともらしい数字を捏造する」 こと。短信 PDF を読ませているのに、なぜか出力された数字が PDF と微妙にズレている — これは決して稀ではなく、何も対策しないと記事に 数字ベースで 5-10% は捏造数値が混入する。
本記事では、運営者が実際に使っている 数字捏造を防ぐ 7 つの運用ルール を公開する。基本ワークフロー全体は別記事 【プロンプト集】決算速報を Claude / ChatGPT に 10〜15 分で書かせる方法 を参照。
注意点 1: PDF を直接渡す。テキスト要約は使わない
人間が PDF を Excel / CSV / 要約テキストに整理して AI に渡したくなるが、これは危険。要約段階での欠落・誤読が記事に乗る。
正解: PDF 本体を Claude / ChatGPT に直接アップロード。両者とも PDF パース機能を持つので、表構造を含めた数字抽出は AI に任せる。人間は「短信 PDF を読み解く部分」を AI に丸投げし、「短信から抽出された数字を検証する部分」に集中する。
例外: 数値が画像化されている古い PDF や、スキャン PDF は AI が読めない。この場合は AI が「読めません」と素直に申告するよう、プロンプトで明示 する(注意点 6 を参照)。
注意点 2: 事前情報を「埋めさせない」
AI は親切心で、知らない数字を埋めようとする。「コンセンサス予想は何ですか」と聞くと、根拠なくそれっぽい数字を返す。これが最も典型的な捏造パターン。
対策:
- プロンプトに 「不明なデータは『不明』と書け、推測で埋めるな」 を必ず入れる
- 事前予想(コンセンサス)は 数字を直接渡す(「予想 5,700 億円」)
- 「業界平均」「セクター比較」など、検証できない比較は 使わせない
例(OK プロンプト):
純利益の事前予想は「5,700 億円(自社プレビュー記事より)」とします。これ以外の予想値は記事に含めないでください。コンセンサスや他社予想に言及する場合は明示的に出典を引用してください。
注意点 3: 出典明記を強制する
「2026 年 3 月期の売上高は X 億円でした」と書かせるとき、出典が短信 PDF のどのページか を併記させる。プロンプトに次の指示を入れる:
各数値の末尾に出典を
(短信 P.5)(株価データ)(プレビュー記事)の形式で記入してください。出典が不明な数値は記事に含めないでください。
これだけで、数字捏造は劇的に減る。AI 自身が「この数字の出典がない」と気づき、ハルシネーション前に止まる。
注意点 4: 株価・為替などリアルタイム値は別口で渡す
決算短信 PDF に株価は載っていない。AI に「当日の株価は?」と聞くと、学習データの古い株価を返してくる。USD/JPY、原油、金利なども同様。
対策:
- 株価・為替・指数は テキストで明示的に渡す(「東証 5/1 終値 ¥6,746、前日比 +906、+15.5%」)
- AI に「学習データの株価は使うな」と明示
- 数字を取得した時刻も渡す(「データ取得 5/1 15:05 JST」)
過去事例: ある記事で「USD/JPY 156 円台」とした後で本当は 158 円台だったことに気付いた。原因は AI が学習データの記憶で書き、人間が検証を飛ばした。リアルタイム値は二重に検証する。
注意点 5: 過去比較は「元データを示してから比較させる」
「前年同期比 +15%」を AI に書かせるとき、前年同期の実数値を渡さない と、AI は「それっぽい伸び率」を計算してしまう。
対策:
- 過去数値は 必ず実数で渡す(「前年同期 5,200 億円 → 今期 6,003 億円」)
- 伸び率は 計算式を併記させる(「(6003-5200)/5200 = +15.4%」)
- 「ほぼ前年並み」「大幅増加」などのファジー表現を使わせる前に、数値ベースの根拠を出させる
注意点 6: 「不明」と書かせる勇気
最も重要な運用ルール。AI は「不明」「分からない」を嫌い、埋める方向にバイアスがかかる。これを逆方向に矯正する。
プロンプト例:
渡されたデータから直接読み取れない情報は、推測で埋めず 「公開情報からは確認できない」 と明記してください。例えば配当性向の計算に必要なデータが PDF にない場合、計算結果を出さず「PDF から直接確認できない」と書いてください。
実例: サンリオ決算延期記事で「具体的な不正報酬額」は press release に記載がなく、AI に書かせると「数億円規模」のような推測値を出す。これを「公表されていない」と書かせる方が、記事の信頼性が高い。
注意点 7: 公開前に数字を 1 つ 1 つ突合する
最後の砦は 人間の検証。AI 出力を読み流して公開すると、注意点 1-6 をすべて守っても 1-2% は捏造数値が残る。
検証手順:
- AI 出力をテキストエディタで開く
- 数字(カンマ・%・倍)を 1 つずつハイライト
- 各数字を PDF / 株価データの該当箇所と突合
- 出典が AI 出力と一致しない数字は 削除 or 修正
- 検証完了後、管理画面に貼り付けて公開
所要時間: 数字 10-15 個で 5-7 分。これを省略すると公開後に「数字違うよ」とコメント付き、サイトの信頼が一気に毀損する。
数字捏造を踏まないためのプロンプトひな型
上記 7 点を統合したプロンプト冒頭テンプレ:
# 入力データの取り扱い
- 添付された決算短信 PDF と、本文で示すテキストデータ以外を一切使わないでください
- 不明な数値は推測せず「公開情報からは確認できない」と書いてください
- 各数値には出典を `(短信 P.5)` `(株価データ)` の形式で末尾に明記してください
- 学習データに含まれる過去の株価・為替・コンセンサスを使わないでください
- 「業界平均」「他社並み」など検証できない比較は使わないでください
# 入力データ
- 短信 PDF: [添付済]
- 株価: 東証 5/1 終値 ¥6,746、前日比 +906、+15.5%、出来高 X 万株(取得 5/1 15:05 JST)
- 事前予想: 純利益 5,700 億円(自社プレビュー記事より)
- 前年同期: 純利益 5,623 億円(短信 P.3 より)
# 出力要件
(9 セクション構造、別記事参照)
まとめ
| 注意点 | 防げる捏造パターン |
|---|---|
| 1. PDF 直接渡し | 要約段階での欠落 |
| 2. 「埋めさせない」 | 親切心で根拠なく数字を埋める |
| 3. 出典明記強制 | どこから来たか分からない数字 |
| 4. リアルタイム値別口 | 学習データの古い株価 |
| 5. 過去比較は実数渡し | それっぽい伸び率の捏造 |
| 6. 「不明」と書かせる | 推測で埋める方向のバイアス |
| 7. 公開前に 1 つずつ突合 | 上記 1-6 を全て守っても残る 1-2% |
これら 7 点を運用に組み込めば、AI 下書き → 検証 → 公開 のサイクルで数字捏造率を 0% に近づけられる。AI は「速さの道具」であって「責任の代替」ではない、というのが運用上の根本姿勢。
関連リンク
本記事は AI ツール利用時の運用方針に関する観察記録であり、特定の金融商品の購入・売却を推奨するものではありません。AI 出力の検証は最終的に人間の責任です。