しんたろーのITアカデミー
開発日記

AIに創業ストーリーを書かせたら、年齢を19歳に捏造された。コードより文章のAI開発が一番難しい。

AIに創業ストーリーを書かせたら、年齢を19歳に捏造された。コードより文章のAI開発が一番難しい。
しんたろーしんたろー
13分で読めます
この記事の内容(目次)

SNS運用を自動化しませんか?

ThreadPostなら、投稿作成・画像生成・スケジュール管理までAIがサポート。

無料で始める

自分の人生をファクトチェックする日

AIに自分の人生を書かせたら、19歳にされていた。

いや、18歳なんだよ。学校の4年目は18歳だ。お前、計算したか?

固有名詞が勝手に出てくる。出会いの時期がズレている。起きていない話がすり替わっている。

自分の人生を自分でファクトチェックする日が来るとは思わなかった。

AIによる事実誤認と、終わらないファクトチェックの泥沼
AIによる事実誤認と、終わらないファクトチェックの泥沼
※この記事は、Claude Codeで1人開発しているSNS運用SaaS「ThreadPost」の開発日記です。

今週の全体像

創業者ストーリーの執筆と、ダッシュボードの計測基盤追加、サムネイル生成ロジックの修正をやった。

全16コミット。新機能4件、バグ修正5件だ。

AIに文章を書かせるのは、コードを書かせるより10倍疲れる。

コードはエラーで動かないから嘘をつけない。文章は平気で嘘をつく。

本日の開発実績:コードより文章の修正に追われた1日
本日の開発実績:コードより文章の修正に追われた1日

AIが僕の過去を捏造する

僕はGeminiに執筆させて、Claudeに校正させる分業制を組んだ。

我ながら悪くない仕組みだと思っていた。

僕が用意したのはファクトシートだ。仕事を始めた時期、彼女と出会った年、学生時代の出来事。

全部時系列で整理して渡した。

「docs: しんたろー取材ノート(全8セクション・生データ下書き)」で512行の生データを書いた。

生い立ちから価値観まで、全セクションの取材を完了させた。

「docs: しんたろーファクトシート(時系列整理・清書版)」で生年月日を確定させた。

これで完璧な自伝が自動生成されるはずだった。

出てきた文章を読んだら「18歳の僕は〜」と書くべきところが「19歳」になっていた。

LLMのコンテキストウィンドウは広大だ。でも長期記憶の整合性維持は別問題らしい。

RAGで事実を注入しても、モデルの創造性が物語の辻褄を勝手に補完する。

「fix: 創業者ストーリー 年齢を19歳→18歳に修正」で手動修正した。

これが1箇所じゃなかった。

「fix: 創業者ストーリー第1章 — 事実誤認修正・固有名詞削除・エピソード追加」で大量の嘘を消した。

彼女との攻防が1回で終わっていた。実際は中3から20歳まで何十回もループしている。

口座没収の時期も中学にされていた。もっと後の話だ。

AIは具体的な地名を見ると、学習データにあるその土地の一般的な情報を勝手に混ぜてくる。

ご当地グルメの話なんて一言も書いていないのに、勝手に追加される。

「地方の田舎」や「地元の学校」と匿名化することで、AIが余計なご当地情報をハルシネーションするのを防いだ。

固有名詞はLLMの幻覚を引き起こすトリガーだ。

しんたろーしんたろー:
全5章のレビュー指摘6件を直させた。「fix: 創業者ストーリー レビュー指摘6件を修正」だ。よし完成と思ったら「第3章の感情の流れが少し唐突かもしれません」とか言い出した。お前が直したんだろ。僕が通したやつを次のフェーズでひっくり返してくる。成功率0%。

僕は章ごとにロックをかける運用に変えた。

「この章は確定。触るな」と明示する。

そうしないと、こいつは善意で書き換えてくる。

「feat: 創業者ストーリー第2章v3修正 + 第3章Gemini指示ファイル作成」で、月40万の具体額を全削除した。

自慢リスクを回避するためだ。

体調不良の描写も、ありがちな症状から実際の体験に直した。

AIは「それっぽい苦悩」を捏造する。実際に経験した体の反応は、ファクトシートに書かないと絶対に出力されない。

「feat: 創業者ストーリー全5章結合版(draft-full.md)作成 + Ch1細部修正」で982行を追加した。

ラケットの木の重さ、ど紫のケースのディテールも足した。

AIは「綺麗な思い出」に仕立て上げようとする。

そのディテールを一つ一つ手作業で注入していく。

「feat: 創業者ストーリー全5章完成」でようやく終わった。

数時間のAIとの対話で終わった。

プロのライターに依頼すれば数週間と数十万円が飛ぶ作業だ。

でも精神的な疲労度はこっちの方が上だ。

僕はファクトシートを渡す前に「確認できない情報は書くな」と最初に釘を刺した。

それだけでハルシネーションが減った。

「事実の正確性」と「文章の流暢さ」はトレードオフだ。

プロンプトエンジニアリングの限界点を見た。

「docs: ストーリー骨格を全面改訂 — 取材ベース共感ドキュメンタリー型5幕構成」で、旧Brain記事ベースの構成を破棄した。

取材データから再構成した。

AIに任せきりにすると、ただの「よくある起業家ストーリー」になる。

泥臭い事実だけを並べるように指示を出し続けた。

幽霊機能の正体

ユーザーが何をクリックしているか、全然わかっていなかった。

ガイドのリンク、Brain記事のリンク。

ダッシュボードに置いていたけど、誰かクリックしているのかすら把握していなかった。

僕は「あったら使うでしょ」で作っていた。

それが急に怖くなった。

「feat: ダッシュボードのガイド・Brain記事クリックをtrackCtaClickで追跡」をコミットした。

コード自体は大した量じゃない。1ファイル、7行の追加だ。

でも計測していない機能は、あるのかないのかわからない幽霊みたいなものだ。

「使われている」「使われていない」で次の判断が全く変わる。

Claudeに「このクリックイベント、trackCtaClickで拾えるようにして」と指示した。

わりとすんなり動いた。珍しく一発だった。

作ったことに満足して計測を後回しにしていた。

データがない状態で改善を続けるのは、目隠しをして時速100kmで高速道路を走るようなものだ。

しんたろーしんたろー:
計測コードの実装は15分で終わった。15分だ。これをサボって機能を作り続けてたら、誰も使わないボタンを量産していた。LTV損失は計り知れない。

SaaSのUI設計において、ヒューリスティック評価やユーザビリティテストは重要だと言われている。

でも1人開発ではそんなリソースはない。

とりあえず作って、出してみる。

その結果を計測しないのは、ただの自己満足だ。

SaaSの平均的なコンバージョン率は数パーセントと言われている。

ダッシュボードのリンクなんて、もっと低いかもしれない。

100人ログインして、1人クリックするかどうか。

その1人を逃さないために、導線を改善し続ける必要がある。

データがなければ、どこを改善すればいいのかすら分からない。

データ分析の基盤が整うと、感情を排除して判断できる。

「この機能はイケてる」という思い込みを、数字が冷酷に打ち砕いてくれる。

それが心地いい。

ここまで読んだあなたに

今なら無料で全機能をお試しいただけます。設定後はAIが投稿案を毎日生成。確認して選ぶだけ。

無料で始める

汚い部屋の呪い

AIに「サムネのビフォー画像を作れ」と指示した。

「fix: トミー式サムネv3を汚い部屋→成功シーンに変更 + A/Bテスト交互ロジック修正」だ。

AIが気を利かせて「汚い部屋」を生成し、それが自分の部屋のイメージとして定着しかけた。

僕は、ビフォー画像に「汚い部屋」を使えばギャップが出てクリックされるだろうと思っていた。

コントラストが強いほど目を引く。マーケティングの基本だ。

Claude Codeに指示してビフォー・アフターの切り替えロジックを組んだ。

見直したら「あ、これ不快だわ」となった。

クリックされる前に離脱している可能性の方が高い。

そもそも僕が見ていて気持ち悪いんだから、ユーザーも同じだ。

不快感は脳の扁桃体を刺激し、即座に回避行動を誘発すると言われている。

Web解析ツールでクリック率だけを見ていると、直帰率の裏にある心理的拒絶を見落とす。

「汚い部屋」を消すために、AIに「清潔感のある成功者」を演じさせるという、謎の自己プロデュース作業に追われる羽目になった。

「fix: トミー式v3サムネのbeforeシーンから不快描写を除去」でゴミやカップ麺の描写を禁止した。

「fix: v3サムネのフォールバック・ルールから余計な「整頓」指定を削除」も入れた。

細かい指定が残っていると、AIが変なところで忖度する。

ネガティブの種類を間違えていた。不快感とギャップは別物だった。

しんたろーしんたろー:
A/Bテストの勝率を追うあまり、自分のブランドをゴミ屋敷にするところだった。危ない。AIは指示通りに極端なものを出してくる。ブレーキを踏むのは人間だ。

AIに「清潔な部屋」と指示すると、今度は不自然なほど整頓された無菌室のような画像を出してくる。

AIは常に極端だ。0か100かしかない。

ちょうどいい「仕事中のリアルな風景」を出すために、プロンプトを何度も調整した。

結局、不快な描写を禁止するだけで、あとは自由にバリエーションを出させるのが一番うまくいった。

数字で振り返る今週のコスト

今週の作業を数字でまとめる。

| 項目 | 今週の数字 | 比較対象 |

|------|-----------|---------|

| コミット数 | 16件 | 先週は22件 |

| 追加行数 | 4,213行 | 企業なら1ヶ月分。僕は1日 |

| 計測実装 | 15分 | 計測なしのLTV損失は数千円/人 |

| AI執筆時間 | 3時間 | 外注なら数週間+数十万円 |

計測コードの実装コストは15分だった。

15分の投資で、ユーザー行動のブラックボックスが開いた。

計測なしで機能改善を続ける機会損失は、ユーザー1人あたり数千円のLTV損失に相当する。

作って満足する開発は、ただの趣味だ。

SaaS開発は、数字を見てからが本番だ。

15分で終わる作業を後回しにしていた自分が恥ずかしい。

誰もクリックしないボタン

ダッシュボードの計測基盤は動いている。

でも、トラッキングした結果の数字はまだ見ていない。

もし「クリック数ゼロ」だったら、あのガイドボタンの存在意義が消える。

FAQ

Q: 計測基盤の導入コストはどのくらいか?

1ファイルの修正で、実装時間はたったの15分だった。既存のトラッキング関数を呼び出すだけだ。これでユーザーの行動が全て可視化される。

Q: AI執筆の再現手順はどうなっているか?

ファクトシートを時系列で作成し、AIに事実として読み込ませる。その後、章ごとに生成と人間によるロックを繰り返す。一気に全編を書かせると必ずハルシネーションを起こす。

Q: ファクトシートとBrain記事の乖離データはどうだったか?

旧Brain記事の構成を破棄し、189行のストーリー骨格を全面改訂した。AIは一般的な成功テンプレートに寄せようとするため、事実とのズレが大量に発生した。泥臭い事実だけを抽出して再構成した。

泥臭い事実だけが残る

AIに人生を捏造され、ゴミ屋敷の住人にされかけた1週間だった。

👉 ThreadPostでSNS運用を自動化する

ThreadPost — SNS投稿をAIが自動化

この記事が参考になったら、ThreadPostを試してみませんか?投稿作成・画像生成・スケジュール管理まで、AIがサポートします。

無料で始める

この記事をシェア

XはてブLINE
しんたろー

ThreadPost開発者・個人開発エンジニア

AI × SaaS個人開発者。Cursor / Claude Code を使った効率的開発、SNS自動化について実体験から発信。

人気の記事