Whisper AIで文字起こし副業:自動化して時給を上げる方法
文字起こし(テープ起こし)は昔からある副業の一つだ。ただ、以前は「1時間の音声を文字にするのに3〜5時間かかる」という労働集約的な仕事だった。
それが、OpenAIのWhisperを使うと、1時間の音声がわずか2〜3分で文字テキストになる。人間が必要なのは確認・修正だけになり、時給換算で10倍以上変わることも珍しくない。
この記事では、Whisper AIの基本的な使い方と、副業として稼ぐための自動化・高単価化のノウハウを解説する。
Whisperとは
WhisperはOpenAIが開発した音声認識(自動文字起こし)AIだ。2022年にオープンソースで公開され、精度の高さと多言語対応で一気に注目を集めた。
主な特徴は以下のとおりだ。
- 精度が高い: 雑音の多い環境でも高精度で認識する
- 多言語対応: 日本語・英語・中国語など99言語以上に対応
- 無料で使える: オープンソース版はローカルPCで無料利用できる
- APIでも使える: OpenAIのAPIを使えばクラウド上で処理できる
使い方の3パターン
パターン1:ローカルで無料利用(Python必要)
自分のPCにWhisperをインストールして使う方法だ。月額コストがかからないが、Pythonの基礎知識が必要になる。
pip install openai-whisper
whisper audio.mp3 --language ja --model medium
mediumモデルがバランスが良く、日本語精度も十分だ。PCのスペックが低い場合はbaseまたはsmallモデルで試してみよう。
パターン2:OpenAI APIを使う(推奨)
OpenAIのWhisper APIを使えば、Pythonのコードが少し書けるだけで処理できる。1分あたり約0.006ドル(2026年現在)とコストが低く、クラウド処理なのでPCスペックに依存しない。
from openai import OpenAI
client = OpenAI()
with open("audio.mp3", "rb") as f:
result = client.audio.transcriptions.create(
model="whisper-1",
file=f,
language="ja"
)
print(result.text)
パターン3:GUIツールを使う(Pythonが苦手な場合)
「Whisper Anywhere」「MacWhisper」などのGUIツールを使えば、音声ファイルをドラッグ&ドロップするだけで文字起こしできる。プログラミング知識は不要だ。
副業として稼ぐための自動化パイプライン
ただWhisperで文字起こしするだけでは、単価が低い案件しか取れない。差をつけるには「後処理の自動化」が重要だ。
Whisper + Claude による高品質仕上げ
- Whisperで文字起こし(約2〜3分)
- 生成されたテキストをClaudeに渡す
- 「誤字修正・句読点補完・話し言葉を書き言葉に変換してください」と指示
- 整形済みテキストを納品
これにより、音声1時間分の文字起こしを15〜20分で高品質に仕上げられる。手動でやれば3〜5時間かかる作業だ。
自動化スクリプトの例
Claudeやn8nと組み合わせれば、「音声ファイルを受け取り → 文字起こし → 整形 → ドキュメント出力」まで一気通貫で自動化できる。
高単価化のポイント
文字起こし単体の相場は1分あたり50〜200円と幅がある。単価を上げるためには「付加価値を乗せる」ことが重要だ。
付加価値の例
| サービス内容 | 単価の目安 |
|---|---|
| 文字起こしのみ | 50〜100円/分 |
| 文字起こし+誤字修正 | 100〜150円/分 |
| 文字起こし+整形+要約 | 150〜250円/分 |
| 文字起こし+ブログ記事化 | 5,000〜15,000円/本 |
| インタビュー音声→記事納品 | 10,000〜30,000円/本 |
特に最後の2つ、「音声をそのままブログ記事や取材記事に変換する」サービスは、Whisper + Claude(またはChatGPT)のコンビで大幅に効率化できる。
受注の取り方
クラウドソーシング
CrowdWorksやLancersで「文字起こし」「テープ起こし」で検索すると、常時数十〜数百件の案件が見つかる。最初は単価が低くても、スピードと品質で実績を積んでいこう。
直接営業
Podcast制作者・YouTube個人チャンネル・士業(弁護士・税理士)などは文字起こし需要が高い。SNSやDMでのアプローチも効果的だ。「音声の文字起こし+整形を1本○円でやります」とシンプルに提案するだけで反応が来ることがある。
収益ロードマップ
0〜2週間: Whisperのセットアップと基本操作をマスター。10〜20本のサンプルを試作
1ヶ月目: クラウドソーシングで受注開始。まずは月5〜10件から
2〜3ヶ月目: Whisper + Claude パイプラインを完成させて時間効率を最大化
3〜6ヶ月目: 「音声→記事化」サービスを確立して月5〜10万円を目指す
注意点
機密情報を含む音声のAPI送信には注意
OpenAI APIに音声データを送信する場合、機密情報(個人情報・企業秘密など)が含まれる場合は利用規約を確認すること。機密性が高い場合はローカルでWhisperを動かすほうが安全だ。
医療・法律・金融分野は要確認
専門性の高い分野の文字起こしは、誤訳・誤字によるリスクが大きい。AI出力を必ず人間がチェックして納品するルールを設けておこう。
まとめ
WhisperはAI副業の中でも「今すぐ始めやすい」ツールの一つだ。
- ローカル版は無料、API版もコストが低い
- Whisper + Claude で時給を大幅アップできる
- 文字起こしだけでなく、記事化・要約など付加価値でさらに稼げる
Claude Codeを使った業務自動化の5つの事例も参考に、自動化スキルを組み合わせることで副収入の柱が一つできる。
AIスキルを体系的に学ぶならDMM WEBCAMP
文字起こし副業を足がかりに、AIを活用した本格的なエンジニアリングやサービス開発を学びたい方にDMM WEBCAMPをおすすめします。
関連ツールを見る
この記事で紹介したツール・サービスをまとめてチェック。
![]()