YouTubeにVR動画を公開中!スマホやVRゴーグルで体験できます!

【AI × 文字読み上げ】ChatGPTからSpeechkiプラグインの有料版を使ってみた

今回ChatGPTのプラグイン「Speechki」の有料版を契約したので、音声の読み上げをしてみました。

この記事の担当者

Yusuke Goto
19歳の時にYouTubeで星のタイムラプス映像を見たのをきっかけに、一眼レフカメラにハマる。その後ドローン映像や、4K60fps映像に感動して、動画も開始。日本の自然をメインに、動画をYouTubeに投稿中。最近は360°カメラで、YouTubeにVR動画を公開しています。

文章読み上げAI「Speechki」とは?

文章読み上げAI「Speechki」とは?

Speechkiは、テキストを自然な音声に変換する文章読み上げAIサービスで、ChatGPTのプラグインとしても誕生しました。

テキストを入力するだけで、リアルタイムでそのテキストを音声として生成でき、棒読みちゃんとは圧倒的な差があります。

多言語のアナウンスや、声に自信がない方でも気軽に音声を作成できるので、様々な場面で利用できます。

実際に有料版のSpeechkiを利用してみた

実際に有料版のSpeechkiを利用してみた

有料版と無料版の違いは、生成できるコンテンツの量で、コンテンツの質には大きな差はありません。

さらに、無料版でもお試しで音声データを生成できるので、試してみましょう。

Speechkiで読み上げファイルを生成してみた

読み上げファイルは自分で文章を作成するのもいいですが、ChatGPTに文章を作ってもらえば、全体は3分程度で完了します。

英語

神奈川県横浜市の観光地をChatGPTにまとめてもらって、そのまま読み上げてもらいました。

英語はやっぱり滑らかですね。

日本語

ビットコインについても日本語でまとめてもらい、そのまま読み上げてもらいました。

日本語でも思ったより滑らかに感じたと思います。

SNSで案内の動画を作成する場合や、お店の放送でも問題ないと思います。

たまに訛ってしまいますが、そこは少しハードルが高いのかもしれません。

Speechkiは音楽ファイルも生成できる

読み上げ機能がメインの機能ですが、音楽生成にも対応しています。

和楽器をメインとした音楽

//実際に打ち込んだプロンプト
・Music utilizing the shakuhachi to create a mystical atmosphere
・Evokes a slight sense of fear
・A track that conveys Japanese culture.
//日本語訳のプロンプト
・尺八を利用した、神秘的な音楽
・少し恐怖を感じられる
・日本の文化を感じられる曲

ラテン系の楽器をメインとした音楽

//実際に打ち込んだプロンプト
・Latin music utilizing the accordion and flute
・Stylish vibe similar to songs like "Ageha Chou" and "Oh! Rival" by Porno Graffitti
・Upbeat tempo.
//日本語訳のプロンプト
・アコーディオンや笛を利用した、ラテン系ミュージック
・ポルノグラフィティの「アゲハ蝶」「オーリバル」のような、かっこいい系
・テンポの良いリズム

和楽器とラテン系のコラボ音楽

//実際に打ち込んだプロンプト
・A collaboration of "Latin" and "traditional Japanese instruments"
・Featuring "accordion" and "shakuhachi" as the main instruments
・Transitions from a slow tempo to an uptempo pace.
//日本語訳のプロンプト
・「ラテン」と「和楽器」のコラボ
・「アコーディオン」や「尺八」をメイン
・ローテンポから、アップテンポに変わる

Speechkiの読み上げ機能は、人間に近づいた

読み上げ機能を聞いたと思いますが、とても人間に近づいています。

完全に僕よりも話が滑らかで、訛りの問題を除けば、あとは一般的に普及するまであっという間だと思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA