
AIが生成した音声を耳にしたことがあるかもしれません。AIが生成した音声は、感情やスタイルに欠け、ロボットのような印象を与えることが多いのが一般的です。しかし、Humeの最新アップデートで、その状況は一変しました。
同社のAI音声生成器の最新バージョンであるEvi 3がついに登場しました。豊富なプリセット音声も用意されていますが、このモデルを他製品より際立たせているのは、そのカスタマイズオプションです。
Humeは私にツールの初期バージョンへのアクセスを提供してくれたので、様々なカスタムボイスを試したり、細部に至るまでカスタムボイスを生成したりすることができました。その様子をご紹介します。
AI音声の作成
Humeシステムにアクセスすると、いくつかのオプションが表示されます。プリセットの音声から選ぶこともできますが、ここでの目的はそれだけではありません。今回新たに追加された機能は、音声をデザインできる機能です。
これを実行すると、AIとの会話が始まります。AIは、生成したい声について質問します。自分でコントロールして、希望する声質を正確に提案することも、Humeが提案するオプションに従ってガイド付きで話すこともできます。
様々な選択肢を試してみました。シンプルなものもあれば、複雑すぎて具体的なものもありました。驚いたことに、ほとんどの声が私の説明にかなりぴったり当てはまりました。
例えば、最初にお願いした声は、かすれ声で、エネルギーが感じられないものでした。まるでファンタジー映画に出てくる、邪悪な王国を統治する悪役のような、悪役らしい雰囲気でした。
最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。
信じられないほど具体的ですが、数分後、まさにその説明にぴったり当てはまる声が私に話しかけてきました。トーンだけでなく、話し方も、私を嘲笑うような、皮肉っぽい口調までもが、まさにその通りでした。
次は、古風なアクセント、溢れるエネルギー、そしてとびきりポジティブな性格の、イギリスのゲーム番組司会者です。アクセントもトーンも、この依頼に驚くほどよく合致していました。
私は海賊のような声からごくシンプルなアメリカ訛りまで、様々な声を試しました。そして、それらはすべてヒュームによって実現されました。
最初から最後まで完璧だったわけではありません。時折、音声が途切れて、わずかにロボットっぽい声になったり、アクセントがずれたりすることもありました。AIと話していることは常に分かりますが、それもほんの少しだけで、ロボットというよりは人間に近い声です。
これらの特定の音声は、Hume AIとの音声会話を通じてのみデザインできます。特に話せない場合は、テキストプロンプトを追加して音声を生成できれば素晴らしいと思います。
これはつまり、音声生成に2倍の時間がかかり、結果を得るには長い会話をしなければならないことを意味します。これは小さいながらも、気になる懸念事項です。
このモデルはどのように一致するのでしょうか?
テキスト、動画、画像の生成と比較すると、AIによる音声生成はそれほど大きな推進力を得ていません。Elevenlabsのような企業が最前線に立ち、GoogleやOpenAIといった企業もこの分野で進歩を遂げています。
しかし、これは声のカスタマイズ、そして声のトーンや個性に関して言うまでもなく、私がこれまで見た中で最高の試みです。
ヒューム氏は、OpenAI の GPT-4o とのブラインド比較で、EVI 3 は共感性、表現力、自然さ、中断品質、応答速度、オーディオ品質において平均して高い評価を受けたと主張している。
同社はまた、このモデルが研究参加者に対して幅広い感情やスタイルをいかにうまく表現したかという評価において、GPT-4o、Gemini、Sesame(人気のAI音声システム)よりも優れていたと主張している。
これにより、Humeは今のところ市場で優位な立場にある。しかし、AIの進化は速い。Humeは現在、AI音声生成、特にクリエイティブな表現の分野でリーダーとして際立っているものの、今後も優位性を維持するには継続的なアップデートが必要となるだろう。
今すぐHume AIダッシュボードでHumeのEvi 3を試すことができます。
Tom's Guideのその他の記事
- マイクロソフトがOpenAIの驚異的なSoraビデオジェネレーターへの無料アクセスをリリースしました。入手方法は次のとおりです。
- AppleのWWDCはAIにとって大失敗になる可能性もあるが、Apple Intelligenceの4つの主要なアップデートが間もなく登場する
- DeepSeekの最新アップデートはChatGPTとGoogleにとって深刻な脅威となる。その理由は?
ノートパソコンに戻る
どんな価格でも
219件の取引のうち10件を表示
フィルター☰
(256GB SSD)
1
(15インチ 1TB)
2
(13.3インチ 256GB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
3
(512GB OLED)
4
(14インチ 128GB)
5
(14インチ 1TB)
私たちのレビュー
☆ ☆ ☆ ☆ ☆
6
7
(15インチ 256GB)
8
9
(青)
10
もっと見る
アレックスはTomsGuideのAIエディターです。現在世界で話題のAIに関するあらゆる情報に精通しており、最高のチャットボット、一風変わったAI画像ジェネレーター、そしてテクノロジー界最大のトピックの一つであるAIの裏側まで熟知しています。
Tom's Guide チームに参加する前、Alex は TechRadar および BBC Science Focus というブランドで働いていました。
彼は BSME 2023 のスペシャリストライター部門で高く評価され、BSME 2025 で最優秀ポッドキャスト賞を受賞したチームの一員でした。
ジャーナリストとして、彼はAIやロボット工学の最新情報、ブロードバンド契約、地球外生命体の存在の可能性、平手打ちの科学など、あらゆる事柄を取材してきました。
最新の AI ホワイトペーパーを理解しようとしていないときは、アレックスは有能なランナー、料理人、登山家のふりをします。