インストールと準備

動画を生成する前に、Python パッケージといくつかの外部依存ツールをセットアップする必要があります。

1. Python パッケージのインストール

最も簡単な方法は pip を使うことです。ターミナル（またはコマンドプロンプト）を開き、以下を実行してください。

pip install slidemovie

これにより、multiai-tts や pptxtoimages を含む必要な Python ライブラリが自動的にインストールされます。

slidemovie は、いくつかの強力なコマンドラインツールの指揮者のような役割を果たします。プログラムを動作させるには、以下のツールをシステムにインストールする必要があります。

Homebrew がインストールされていない場合は brew.sh を参照してください。

brew install ffmpeg pandoc poppler
brew install --cask libreoffice

sudo apt update
sudo apt install ffmpeg pandoc libreoffice poppler-utils

FFmpeg: ffmpeg.org からダウンロードして解凍し、bin フォルダをシステムの環境変数 PATH に追加してください。
Pandoc: pandoc.org からインストーラーをダウンロードして実行してください。
LibreOffice: 標準のデスクトップ版をインストールしてください。コマンドラインの soffice が PATH に通っていることを確認してください。
Poppler: Windows 用のバイナリリリースをダウンロードし、bin フォルダを PATH に追加してください。

slidemovie は multiai-tts ライブラリを使用してナレーション音声を生成します。モデルの選択と API キーの設定が必要です。

まず、引数なしで slidemovie コマンドを実行してください。

slidemovie

オプションがないためエラーが出ますが、これは想定された動作です。この実行により、デフォルトの設定ファイルが ~/.config/slidemovie/config.json に自動作成されます。

次に、設定ファイル のページを参考にこのファイルを編集し、tts_provider, tts_model, tts_voice の項目を変更して、使用する TTS モデルを設定してください。

モデルの選択は設定ファイルで行いますが、API キー の設定は multiai の設定に従います。

API キーの設定方法については、multiai の公式ドキュメント の指示に従ってください。

注意: 選択したプロバイダー（Google Gemini または OpenAI）に対応する正しい API キーが設定されていない場合、音声生成のステップで失敗します。