Text To Wav ★
Text To Wav は Sapi 4.0, Sapi 5.1, AquesTalk などの音声合成エンジンに対応した、テキスト読み上げソフトです。
そのほかに
- 英語学習などに使える日英の分を読み分ける機能
- IE コンポーネントを使ったソフトの読み上げ機能
- 複数のテキストやHTMLを WAV/MP3(lameを使用) に一括変換できます。
- 実行ファイルにドラッグ&ドロップやコマンドラインからも変換できます。
- IPod などのプレイヤーで表示できる歌詞付の MP3 を作成したり、字幕と音声を同期した動画形式で出力機能
といった読み上げ機能をフルに活用した多機能なソフトです。
読み上げ機能
主な読み上げ機能は次の通りです。
- 入力した文やテキストファイルの読み上げ
- センテンス単位での読み上げ
- カレットの位置からの読み上げ
- クリップボードにコピーしたテキストの読み上げ
- キーボードから入力した文字や、カレットを移動させた範囲の読み上げ
- IE コンポーネントを使用したソフトの読み上げ
5 のキーボード機能は、Config の Speak Editor's Text をチェックすると可能になります。
6 の機能は、IE はもちろん、例えば、CHM などのヘルプファイルを読み上げたり、IE コンポーネントを使用したソフト(私のソフトで言えば Luna)などの読みあげをする機能です。
音声変換機能
Text To Wav では、読み上げ内容を音声ファイルとして書き出す場合、様々な Option があります。
先ず出力形式について説明します。
- Wav
テキストを WAVE ファイルとして出力します。
- MP3
上の WAVE ファイルを lame を使ってMP3 に変換します。
- Lyrics MP3
上の MP3 をさらに加工して、WMP や IPod などで歌詞を同期させて表示できる形式にします。
- Movie
上の WAVE ファイルを字幕付きで AVI ファイルとして出力します。
FFmpeg が Plugins フォルダ内にあれば、そちらを使用して変換します。
次に、少し複雑な Option の説明をします。
Text To Wav の特徴の一つとして、音声エンジンを2つ使っての日英の文を読み分け機能があります。
この機能を使って音声ファイルに出力する場合、いくつかの条件を満たす必要があります。
- Use Control Tag がチェックされている
- Convert at Two Voices がチェックされ、かつ、使用可能状態になっている
- 設定している Voice が両方とも SAPI 5 である
- 設定している Voice が両方とも SAPI 4 である
SAPI 4 の場合は次のようにして変換します。
- Voice1、Voice2 を使って WAVE ファイルを2つ作成します。
この WAVE ファイルは、 SAPI4 の機能である Control Tag を使って、センテンスごとに 2 秒の無音区間が付加されています。
- 最後に、無音の部分を目印に交互に結合していきます。
センテンスの読み上げ時間に Pause Rate で指定した値をかけただけの無音の間を置きます。
変換ファイルリストに追加するには、メニューの File から開いてリストに加えるか、
変換したいファイルをドラッグアンドドロップしてリストに加えます。
変換を開始するには以下の方法があります。
- 変換ファイルリストの項目を右クリックして Convert を選択する
- Menu > Command > List to Audio Files を実行する
- Menu > Command > Convert to an Audio File を実行する
この場合はエディタに表示されているテキストを変換します。
- IE などから、変換したい文章を ドラッグ&ドロップして変換する。
Text To Wav 左端の File Tab を開いてそこにドロップします。
出力するファイル名の付け方を解説します。
ファイル名は、次のタグを入力して保存するファイル名を指定することができます。
test.html を WAVE ファイルに変換する場合を例に説明します。
- <name> はファイル名に置き換わります。
test.wav
- <title> は html 形式のファイルを開いたときに、タイトルバーに表示される名前です。
test.wav
- <cnt> は 01, 02 など二桁の数字をリストのインデックス順に付加します。
cnt=3というように、イコールを付けて数字を指定すると、開始インデックスを決めることができます。
00.wav
Config
- Use Clipboard Aloud
ClipboardにCopyしたTextをSpeakします。
- Use Control Tags
Tagを使ってVoiceをControlする
- Use Dictionary
辞書を使う
- Use Hotkey
- Always on Top
常に際前面に表示をする
- Speak Editor's Text
エディタに入力した文字などを読み上げます。
- Automatic Change Voice
Voice1 と Voice2 の音声を自動で切り替えます。
Voice1 には日本語などの2バイト文字の、音声合成エンジン
Voice2 には英語などの1バイト文字の、音声合成エンジンを設定すると読み分けてくれます。
- Convert at Two Voices
二つの音声を使ってAudio変換
ToolBar1

Left
- Font Size Slider
- Font Name
- Font Language
- Color Selector
Right
- Voice1, 2
それぞれのTTSエンジンの各種設定を切り替える。
- TTS ComboBox
使用する話者の選択。
- Speed Slider
- Pitch Slider
- Volume Slider
- PauseRate
Convert At Two Voices を使って変換する時、音声を切り替わる時の間
- Output File Format
- WAV
- MP3 (need lame_enc.dll or lame.exe)
- MP3(Lyrics) (need lame_enc.dll or lame.exe)
- Movie
- Output WAVE Format
For Sapi5
ToolBar2
- Open/Close
-
- ツールバーの上のペインの開閉をします。
- View Mode
-
- Source View
テキスト形式のファイルの読み上げと編集ができるモードです。
- Html View
HTML 形式のファイルのタグを取り除き、テキストだけを抽出したリードオンリーのモードです。
- IE Reader
IE Component を使っているソフトに、本ソフトを重ねて Play ボタンを押すと読み上げをするモードです。
- Commands
-
- Play
- Speak From Caret
- Speak Prev Sentence
- Pause/Resume
- Speak Next Sentence
- Convert to Audio
- ETC
-
- Option
- Dict
辞書を使って読み上げる文を変更する
- Regex
正規表現を使って読み上げる文を変更する
- Audio
出力先のフォルダの設定と、MP3 変換する時に使う Lame の設定
- HotKey
- Always on Top
そのほかの使い方
MP3 で音声ファイル出力
MP3へ変換する場合はlame_enc.dllかlame.exeが必要です。
インストールのしかたはこちらから
http://lame.jthz.com/
1. 一番上にあるlame 3.97をダウンロードします。
2. それを解凍してできたフォルダの中にある lame_enc.dllかlame.exe を
実行ファイルがあるフォルダかPluginsフォルダあるいは、WINDOWSやSYSTEMフォルダ入れます。
後は、ソフトを起動して、FormatのMP3を選択することができればインストール完了です。
FFmpeg を使って動画ファイル出力
FAQ
-
起動時にエラーメッセージが表示されて終了してしまいました。、
もしかするとSAPI4がインストールされていない可能性があります。
その場合は下記のサイトのつながる方へ行き必要なものをダウンロードします。
http://www.microsoft.com/msagent/downloads/user.aspx
http://web.archive.org/web/20071011004249/http://www.microsoft.com/msagent/downloads/user.aspx
Windows 95, 98の場合は、下の項目全部を
ME, 2000, XP, Vista の場合は、3と4だけを実行してください。
- Microsoft Agent and localization supportセクションの
Download the Microsoft Agent core components (395 KB exe)をダウンロード
- 同セクションのSelect a languageと書かれたコンボボックスから Japanese (127 KB exe)を選び
Download selected language componentをクリックしてダウンロード
- Text-to-speech engines:セクションの
Select a text-to-speech (TTS) engineと書かれたコンボボックスより
Japanese (3 MB exe)を選び、Download selected engineをクリックしてダウンロード
- SAPI 4.0 runtime support:セクションの
Download the Microsoft SAPI 4.0a runtime binaries (824 KB exe)を選びダウンロード
最後にダウンロードしたものを全部実行してインストールすれば完了です。
2008年11月現在 Microsoft のページからはダウンロードできなくなっているようです。
代わりのダウンロード先のリンクを取得するには
http://noah0.blog119.fc2.com/blog-entry-97.html
こちらに詳しく書きましたのでダウンロードできない場合は試してみてください。
よくわからない方は、下の FAQ にリンク張っておいたので、そちらから必要な物を直接ダウンロードすることもできます。
-
SAPI4の音声合成エンジンはどこにあるか教えて。
-
Vista などで使える日本語合成エンジンはどこですか?
動作が不安定でもいいのであれば、上の FAQ の SAPI4 から音声エンジンなどをインストールしてください。
こちらもまだ未完成のため動作が不安定ですが、他の合成エンジンとして AquesTalk も使うことができます。
インストールの仕方は、先ず、下記リンクの AquesTalk セクションの AquesTalk Win aqtk20090609.zip をダウンロードします。
AquesTalk
次にダウンロードしたファイルの中にある bin フォルダ内にある、AquesTalk.dll, AquesTalkDa.dll を
TextToWav のフォルダ内にある Plugins フォルダに入れます。
そうすると AquesTalk の音声エンジンが使えるようになります。
Text To Wav の開発環境が XP なので、AquesTalk が使えるかは試せていません。
なのでもしかしたら動作しないかもしれません。
-
しゃべっている途中で句点もないのに間をおくのはなぜ?
L&H 社の日本語合成エンジンの場合、句点などがない状態でたくさんの文字を
喋らせると読み飛ばしてしまうので、プログラム内部で適切に句点を打っているからです。
-
たまに読み飛ばしてしまうことがあるんだけど・・・
これも上記と同じ理由で、英語と日本語の混在文の場合、少しの文字でも負荷が高まるので
読み飛ばしてしまう場合があります。
-
ボタンなどの概観を変更できますか?
ツールバーのボタンは Resources フォルダ内の画像を描き変えることで概観を変更することができます。