iPhoneによる音声入力の精度向上のために、自分が書いたテキストを使う話 by #ChatGPT

2025年6月4日


はじめに

結城さんから「iPhoneでの音声入力による文章作成を、もう少し快適にできないか」とのご相談がありました。現在はSimplenoteに音声入力し、そのテキストをiOSショートカット経由でChatGPTに渡して清書してもらうというワークフローを確立されています。この方法は実用的であり、十分に満足できる精度もあるものの、あと一歩の手間軽減や精度向上が望めそうだという観点から、新たな可能性について話が展開されました。


背景と現状

  • 音声入力はiPhoneのApple標準音声認識を使用
  • Simplenoteに一旦テキストを保存
  • iOSショートカットでプロンプト付きでChatGPTへ渡し、清書
  • 清書後のテキストはメールマガジンやnote、連載原稿などに活用

新たな発想:プロンプトを「学習」させる

この流れの中で生まれたアイデアが、

「Appleによる音声書き起こし」と「自分が実際に書いた文章」との違いを活かし、ChatGPTのプロンプトを最適化する

というものです。

発想のポイント

  • 音声入力は便利だが、Appleの変換には「Apple流の表記」や「自分の文体とのズレ」がある
  • 結城さん自身の文章(メルマガ、連載、エッセイ等)には、一貫した文体と表記のルールが蓄積されている
  • この2つのテキスト(Apple起こし vs. 結城清書)を比較することで、「変換ルール」「表記傾向」が見えてくる
  • それをChatGPTへのプロンプトに反映させることで、音声入力→清書の精度を向上できる可能性がある

想定されるアプローチ

ステップ1:比較用ペアの作成

  • Apple音声入力で得られた生テキスト(Simplenoteなど)
  • 結城さんが実際に清書した完成原稿(メルマガ、Web連載など)

ステップ2:差分の抽出

  • 「ひらがな・漢字の使い分け」や「英語表記の揺れ」などを分類
  • 誤変換パターンや好まれる表記スタイルを明示化

ステップ3:プロンプトの強化

  • 「次のような表記を好みます」として、変換ルールをプロンプトに明記
  • 例:「“こと”は漢字にせず、ひらがなで書く」「“address”は英語で残す」など
  • YAMLやJSON形式で保存して再利用も可能

応用の可能性

  • 「時期ごとの文体」や「テーマ別の語彙選好」なども反映可能
  • 将来的には、自分の文体で代筆するAI秘書的なプロンプトにも発展しうる
  • 音声入力が苦手な漢字や語句を逆引きで抽出する「表記ブック」的データベースも作れる

おわりに

現時点でも、SimplenoteとショートカットとChatGPTの連携で、非常に実用的な執筆環境が構築されています。しかし、すでに膨大に蓄積された「あなたらしい文章」を活用し、プロンプトそのものを進化させるというこの発想は、AI時代の新しい執筆補助の形として、とても興味深いものです。

結城さん、また一緒にこのプロンプト改善プロジェクトを育てていきましょう。

(2025年6月4日)