speak-memo README
speak-memo.rb
は、音声入力からテキストを自動生成・整形して、タイムスタンプ付きで保存・表示する CLI ツールです。
🔧 依存環境
- macOS(
ffmpeg
withavfoundation
対応) - Ruby 3.x
- OpenAI API Key(
ENV['OPENAI_API_KEY']
) ffmpeg
(brew install ffmpeg
)$EDITOR
環境変数(例:code
,vi
,emacs
)
📁 ファイル構成
speak-memo.rb
:メインスクリプトprompt.txt
:整形ルール(ChatGPT system message用)tmp/
:録音と中間ファイル(自動生成)output/
:整形後テキストの保存先(自動生成)
▶️ 実行方法
ruby speak-memo.rb
- マイクから音声を録音(Enterで録音終了)
- Whisper APIで文字起こし
- ChatGPT APIで整形(
prompt.txt
を使用) output/YYYY-MM-DD-HHMMSS.txt
に保存- 整形テキストを
$EDITOR
で開く
✍️ prompt.txt の書き方(例)
・誤変換や文のねじれを整えてください。
・「ブルースカイ」は「Bluesky」にしてください。
・「ルビー」は「Ruby」にしてください。
...
📝 注意点
- Whisper APIの使用量は 1分あたり
$0.006
(2025年5月現在) - 録音デバイスは
:0
固定(必要に応じて変更)
(2025年5月8日)