インストール
インストールと準備
動画を生成する前に、Python パッケージといくつかの外部依存ツールをセットアップする必要があります。
1. Python パッケージのインストール
最も簡単な方法は pip を使うことです。ターミナル(またはコマンドプロンプト)を開き、以下を実行してください。
pip install slidemovie
これにより、multiai-tts や pptxtoimages を含む必要な Python ライブラリが自動的にインストールされます。
2. 外部ツールのインストール
slidemovie は、いくつかの強力なコマンドラインツールの指揮者のような役割を果たします。プログラムを動作させるには、以下のツールをシステムにインストールする必要があります。
必要なツール
- FFmpeg: 音声の処理や、画像と音声を結合して動画ファイルにするために使用します。
- Pandoc: Markdown テキストファイルを PowerPoint (
.pptx) ファイルに変換するために使用します。 - LibreOffice: PowerPoint スライドを高解像度の画像に変換するために(ヘッドレスモードで)使用します。
- Poppler (pdftoppm): スライドから画像を抽出するために使用される PDF レンダリングライブラリです。
インストールコマンド
macOS の場合 (Homebrew 使用)
Homebrew がインストールされていない場合は brew.sh を参照してください。
brew install ffmpeg pandoc poppler
brew install --cask libreoffice
Ubuntu / Debian の場合
sudo apt update
sudo apt install ffmpeg pandoc libreoffice poppler-utils
Windows の場合
- FFmpeg: ffmpeg.org からダウンロードして解凍し、
binフォルダをシステムの環境変数 PATH に追加してください。 - Pandoc: pandoc.org からインストーラーをダウンロードして実行してください。
- LibreOffice: 標準のデスクトップ版をインストールしてください。コマンドラインの
sofficeが PATH に通っていることを確認してください。 - Poppler: Windows 用のバイナリリリースをダウンロードし、
binフォルダを PATH に追加してください。
3. AI APIキーの設定
slidemovie は multiai-tts ライブラリを使用してナレーション音声を生成します。モデルの選択と API キーの設定が必要です。
1. TTS モデルの選択
まず、引数なしで slidemovie コマンドを実行してください。
slidemovie
オプションがないためエラーが出ますが、これは想定された動作です。この実行により、デフォルトの設定ファイルが ~/.config/slidemovie/config.json に自動作成されます。
次に、設定ファイル のページを参考にこのファイルを編集し、tts_provider, tts_model, tts_voice の項目を変更して、使用する TTS モデルを設定してください。
2. API キーの設定
モデルの選択は設定ファイルで行いますが、API キー の設定は multiai の設定に従います。
API キーの設定方法については、multiai の公式ドキュメント の指示に従ってください。
注意: 選択したプロバイダー(Google Gemini または OpenAI)に対応する正しい API キーが設定されていない場合、音声生成のステップで失敗します。