【完全版】Whisper APIのエラーをFlask×PythonAnywhereで解決した話|初心者の私でもできた実装記録

🌤️ 朝8時、コーヒーとともに開発スタート

今日は朝の8時から、FlaskアプリにOpenAI Whisper APIを組み込む作業に没頭しました。
座った姿勢のまま、気づけば夕方の18時までキーボードを叩き続ける一日。

🧩 何がそんなに大変だったのか

以下が、今回直面した「壁」のリストです。

  • Whisper APIの書き方が v1.0以降で変更 → 古い記述でエラーが出続ける
  • PythonAnywhereではパスが複雑で、複数バージョンが混在
  • 仮想環境のsite-packagesを明示しないと読み込まれない
  • 環境変数(APIキー)の読み込みがうまくいかない
  • 録音ファイルの形式(webm)→ wav への変換にffmpegが必要
  • Flask-Mailのインポートで “モジュールがありません” と言われる
  • インストールしてもWSGI経由では認識されず
  • 正しくインストールしても依然として認識されない(パスが違う)
  • Whisper APIから “insufficient_quota” のエラー → 無料では使えなかった!
  • 支払い登録にはクレジットカード必須で、入力にかなり勇気が必要でした

🔧 解決へのステップ

  1. pip install openai==0.28 で旧バージョンを明示インストール
  2. sys.path に正しいsite-packagesパスを挿入
  3. load_dotenv(path) を明示的に記述
  4. Whisper使用にはOpenAIの課金が必要と知り、登録を完了
  5. Flask-Mailの読み込みに苦戦しつつ、複数回インストール&設定で突破

📝 実装できた機能

最終的には、録音音声をWhisperに送り、文字起こし&発音の一致率スコアを表示する機能が完成。
スマホでも簡単に使えるUIになり、録音 → 送信 → 結果表示までがスムーズに。

📝 AIの文字起こし: Hello, Mr. Brown. How are you? I’m fine. Good. How about you?

🎯 一致率スコア: 22.5%

📚 信頼できる学びのサポート(アフィリエイト)

🧑‍🏫 本気で学びたい方向け:
TechAcademyのPythonコース — マンツーマン指導で、短期間に実力をつけたい人へ

📺 気軽に学びたい方向け:
Schoo(スクー) — ライブ配信と動画学習が見放題。スキマ時間に最適。

🌱 読者のみなさんへ

今回のような作業は、周囲に詳しい人がいたら一言で解決できたかもしれません。
でも、ひとつひとつ試して自分でたどり着いた達成感は、かけがえのない経験でした。
同じように孤独にがんばっている方と、いつか繋がれたらうれしいです。

最後まで読んでいただき、本当にありがとうございました。

上部へスクロール