speak-memo README

speak-memo.rb は、音声入力からテキストを自動生成・整形して、タイムスタンプ付きで保存・表示する CLI ツールです。

🔧 依存環境

  • macOS(ffmpeg with avfoundation 対応)
  • Ruby 3.x
  • OpenAI API Key(ENV['OPENAI_API_KEY']
  • ffmpegbrew install ffmpeg
  • $EDITOR 環境変数(例: code, vi, emacs

📁 ファイル構成

  • speak-memo.rb:メインスクリプト
  • prompt.txt:整形ルール(ChatGPT system message用)
  • tmp/:録音と中間ファイル(自動生成)
  • output/:整形後テキストの保存先(自動生成)

▶️ 実行方法

ruby speak-memo.rb
  1. マイクから音声を録音(Enterで録音終了)
  2. Whisper APIで文字起こし
  3. ChatGPT APIで整形(prompt.txtを使用)
  4. output/YYYY-MM-DD-HHMMSS.txt に保存
  5. 整形テキストを $EDITOR で開く

✍️ prompt.txt の書き方(例)

・誤変換や文のねじれを整えてください。
・「ブルースカイ」は「Bluesky」にしてください。
・「ルビー」は「Ruby」にしてください。
...

📝 注意点

  • Whisper APIの使用量は 1分あたり $0.006(2025年5月現在)
  • 録音デバイスは :0 固定(必要に応じて変更)

original gist

(2025年5月8日)