夜風のMixedReality

xRと出会って変わった人生と出会った技術を書き残すためのGeekなHoloRangerの居場所

ZyphraのZonosのAPIに関して調べる その③

本日はAI枠です。

先日新型のTextToSpeechサービスのZyphraのZonosを触っていました。

redhologerbera.hatenablog.com

サイドメニューを見るとSettingsの中にAPIKeysおよびAPI Documentationが存在しました。

前回はPythonで生成する点までを行いました。

redhologerbera.hatenablog.com

今回は音声の言語の変更を行っていきます。

〇環境

・Windows11PC

・Anaconda

・Python3.11

〇音声の変更

 本日時点でZonosは英語、ドイツ語、フランス語、韓国語、中国語、日本語に対応しています。

webページからはボタン一つで言語を変更する必要があります。

 

これをPythonで実現するには以下のようにします。

from zyphra import ZyphraClient

client = ZyphraClient(api_key="APIキー")

# Text-to-speech
audio_data = client.audio.speech.create(
    text="Hello, world!",
    language_iso_code="ja",
    speaking_rate=15,
    mime_type="audio/wav"
)

# 音声データを 'output' フォルダに 'speech.wav' として保存
with open("output/speech.wav", "wb") as f:
    f.write(audio_data)

ここではクライアントに投げる際に language_iso_code="ja",というオプションを追加しています。

これは言語コードであり、jaが日本語です。英語の場合はen-enとなります。

 これによって日本語の音声が作られますが、現状text="Hello, world!",と英語のテキストになっています。

 このままでは日本語英語になってしまうので「こんにちは!」などに変更することで日本語が返されます。

本日は以上です。 次回はCloneVoiceをPythonで実装していきます。