speak-memo README
speak-memo.rb は、音声入力からテキストを自動生成・整形して、タイムスタンプ付きで保存・表示する CLI ツールです。
🔧 依存環境
- macOS(
ffmpegwithavfoundation対応) - Ruby 3.x
- OpenAI API Key(
ENV['OPENAI_API_KEY']) ffmpeg(brew install ffmpeg)$EDITOR環境変数(例:code,vi,emacs)
📁 ファイル構成
speak-memo.rb:メインスクリプトprompt.txt:整形ルール(ChatGPT system message用)tmp/:録音と中間ファイル(自動生成)output/:整形後テキストの保存先(自動生成)
▶️ 実行方法
ruby speak-memo.rb
- マイクから音声を録音(Enterで録音終了)
- Whisper APIで文字起こし
- ChatGPT APIで整形(
prompt.txtを使用) output/YYYY-MM-DD-HHMMSS.txtに保存- 整形テキストを
$EDITORで開く
✍️ prompt.txt の書き方(例)
・誤変換や文のねじれを整えてください。
・「ブルースカイ」は「Bluesky」にしてください。
・「ルビー」は「Ruby」にしてください。
...
📝 注意点
- Whisper APIの使用量は 1分あたり
$0.006(2025年5月現在) - 録音デバイスは
:0固定(必要に応じて変更)
(2025年5月7日)