【2025年最新版:音のプロが徹底解説】ボイスレコーダー の文字起こし7つの方法
この記事の目次
会議や商談、取材などでボイスレコーダーを使うことがあるかと思います。
近年はアプリなどでも文字起こしが楽にできるようになりました。
今回の記事では、気軽にボイスレコーダーを文字起こしするツールやサービス、無料から有料まで6つの方法で徹底解説していきます。
ICレコーダー?
一昔前まではボイスメモの代わりとしてICレコーダーが発売されていました。
現代では、スマホでも録音可能ですが、より高音質で音声を残すためには是非レコーダーの購入も検討してください。
こちらの記事もチェック!
方法1:nottaを使う
文字起こし時間:120分/月、AI要約:10回/月までなら無料で使うことができます。
プレミアムプランでは、文字起こし時間:1800分/月、AI要約:30回/月で、千円ちょっとなのでかなりリーズナブルじゃないかと思います。
フォーマルな会議など、整然とした発言が行われる場合には、認識率は98.86%以上となっているので安心。
専用アプリでかんたん操作。
とりあえずこれ入れておけばOKな安心感があります。
120分までは無料なので、まずは一度会議にて無料で使ってみて、使いやすかったら有料版を契約という形でいいでしょう!
議事録作成の手間を大幅に軽減【Notta】方法2:PLAUD NOTEを使う
通常の音声録音、会議に通話まで対応したサービスで、ハードの導入が必要なので、少し初期費用はかかりますが、非常に精度の高い文字起こしが可能です。
また、要約の技術には今話題のchat GPT 4oが搭載されているので、非常にわかりやすく、明瞭なフレージングで要約してくれます。
6ヶ月で全世界5万ユーザー&12億円売り上げAIボイスレコーダー PLAUD NOTE方法3:MyEdit(マイエディット)を使う
PCなどのデバイスを頻繁に使う方ならMyEdit(マイエディット)を使うのもいいかもしれません。
オーディオだけではなく画像関係のAI処理もできるプランあり。
無料版では、お試し程度になりますが、有料版でも月々580円(2024年12月時点)となっていますので、リーズナブルに使用可能。
基本的には録音した音声MP3データをアップロードしてテキスト化しますので、PCベースの作業に向いています。
テキスト化の他にもボイスチェンジャーやファイル変換、ノイズの除去、声のトーン変更、ボーカルや伴奏の抽出、 BPM 測定、音声のトリミング・カット、AI 効果音作成など、音声編集に関する様々な機能が揃っていますので、効率よく作業することができます。
方法4:Google or Microsoftを使う
Googleドキュメントや、Microsoft 365 に加入している場合に使用できるWord内の機能である「ディクテーション」を使い文字起こしが可能になります。
ただし、Googleドキュメントは、ブラウザ上でのみの利用になりますし、MicrosoftもWordを立ち上げてリアルタイムでの文字起こしとなり、録音した音声を文字起こしできるわけではないため、使い勝手は非常に悪く、特定の環境下でのみ力を貸してくれる形になるでしょう。
方法5:Microsoft Azure APIを使う
マイクロソフトの無料API枠を使って、音声認識APIをプログラムすれば自作でテキストの文字起こしや音声の読み上げプログラムを作ることができます。
Kotaro Studioアカデミーの方でやり方はかなり詳しく解説していますので、興味があればチェックしてみてください。
方法6:Pythonを使った無料文字起こし
Pythonを使えば、手軽に無料で文字起こしを行えます。
人気のライブラリ SpeechRecognition
を使った簡単なサンプルコードを紹介します。
pip install SpeechRecognition pydub
pipでライブラリーをインストールしてください。
また、pydub
を利用する際に ffmpeg
が必要になりますので、以下のリンクなどからダウンロードしてインストールしてください。
(FFmpegは環境変数またはパスの指定が必要な場合があります)
PythonのSpeechRecognition
ライブラリ内に組み込まれている無料のサービスは、Googleの音声認識エンジンを簡易的に利用しています。
APIの取得や設定が不要で、使いやすいですが、あまり一度に大量のアクセスをすると制限がかかる場合があるので、アプリとしてリリースしたりするのはやめておきましょう。
また、無料で提供されているものになりますので、長時間の音声や大量のリクエストには向かない可能性があることも理解しておく必要があります。
以下のコードでは、文字起こしの結果を デスクトップ に保存するように設定しています。
Pythonスクリプトがどのフォルダから実行されても正しくデスクトップに保存されるよう、os
モジュールを使用してデスクトップのパスを取得します。
WAVEの場合
import os
import speech_recognition as sr
# デスクトップのパスを取得
desktop_path = os.path.join(os.path.expanduser("~"), "Desktop")
# 音声ファイルのパスを指定(WAVファイル)
audio_file = "your_audio_file.wav"
# 音声認識の初期化
recognizer = sr.Recognizer()
# WAVファイルを読み込む
with sr.AudioFile(audio_file) as source:
print("音声を読み込んでいます...")
audio_data = recognizer.record(source)
try:
# Googleの音声認識エンジンを使用して文字起こし
text = recognizer.recognize_google(audio_data, language="ja-JP")
print("文字起こし結果:")
print(text)
# テキストをデスクトップに保存
output_file = os.path.join(desktop_path, "transcription_wav.txt")
with open(output_file, "w", encoding="utf-8") as file:
file.write(text)
print(f"文字起こし結果を保存しました: {output_file}")
except sr.UnknownValueError:
print("音声を認識できませんでした。")
except sr.RequestError as e:
print(f"エラーが発生しました: {e}")
MP3の場合
import os
import speech_recognition as sr
from pydub import AudioSegment
# デスクトップのパスを取得
desktop_path = os.path.join(os.path.expanduser("~"), "Desktop")
# MP3音声ファイルのパスを指定
mp3_file = "your_audio_file.mp3"
wav_file = os.path.join(desktop_path, "converted_audio.wav") # デスクトップに変換したWAVを保存
# MP3をWAVに変換
sound = AudioSegment.from_file(mp3_file, format="mp3")
sound.export(wav_file, format="wav")
print(f"MP3をWAV形式に変換しました: {wav_file}")
# 音声認識の初期化
recognizer = sr.Recognizer()
# WAVファイルを読み込む
with sr.AudioFile(wav_file) as source:
print("音声を読み込んでいます...")
audio_data = recognizer.record(source)
try:
# Googleの音声認識エンジンを使用して文字起こし
text = recognizer.recognize_google(audio_data, language="ja-JP")
print("文字起こし結果:")
print(text)
# テキストをデスクトップに保存
output_file = os.path.join(desktop_path, "transcription_mp3.txt")
with open(output_file, "w", encoding="utf-8") as file:
file.write(text)
print(f"文字起こし結果を保存しました: {output_file}")
except sr.UnknownValueError:
print("音声を認識できませんでした。")
except sr.RequestError as e:
print(f"エラーが発生しました: {e}")
Python環境をお持ちの方は是非トライしてみてください。
方法7:文字起こしさんを使う
AI文字起こしサービス『文字起こしさん』が便利に使えます。
文字起こしさん」は、音声、動画、画像ファイルをAIで高精度に文字起こしするオンラインサービスです。
ウェブブラウザから利用可能で、インストール不要なので、気軽に利用できます。
- 対応ファイル形式: 音声(MP3、WAV、AACなど)、動画(MP4、MOV、AVIなど)、画像(JPG、PNG、PDFなど)に対応しています。
- 対応言語: 約100言語に対応しており、多言語の文字起こしが可能です。
- 料金プラン:
- フリー: 登録不要で、音声1分/月、画像3枚/月まで無料で利用可能です。
- ライト: 無料会員登録で、毎日音声10分、画像10枚まで利用可能です。
- ベーシック以降: 月額1,000円からの有料プランがあり、利用可能な時間や枚数が増加します。
- 機能:
- AIによる高精度な文字起こし。
- 音声と文字を同時に確認できる再生機能。
- 文字起こし履歴の閲覧と検索機能。
- 1文単位の字幕ファイル作成機能。
利用方法:
- ウェブブラウザから「文字起こしさん」のサイトにアクセスします。
- 音声、動画、画像ファイルをアップロードします。
- AIが自動的に文字起こしを行い、結果が表示されます。
- 必要に応じてテキストを編集し、ダウンロードや共有が可能です。
まとめ
手軽にはじめるなら、nottaか文字起こしさんがおすすめ!
会議の文字起こしなら【Notta】仕事でバリバリ使いたい方やジャーナリスト向けにはこれ!
世界初ChatGPT-4連携AIボイスレコーダー PLAUD NOTE他には昨今だと、例えばPremiere Proなどの動画編集ソフトにもテロップ目的で文字起こしの機能が搭載されていることがほとんどですので、うまく使えば低コストで文字起こしが実現できるかもしれません。
みなさんの参考になれば幸いです。