
昨日(9月30日)に開催されたAmazonのデバイス&サービスイベントにおいて、同社はAlexa+の機能を最大限に活用するように設計された第一世代の製品を発表しました。新しいEchoスマートスピーカーやディスプレイから、新しいFire TVデバイスやRingカメラまで、これらのガジェットの処理能力の向上により、AmazonのAI搭載音声アシスタントとのより緊密な連携が可能になります。
これらのデバイスで何ができるのか、そして次世代のスマートグラスやピザの注文がいかに簡単になるかなど、Amazon が他の Alexa+ 対応デバイスでどこを目指しているのかを詳しく知るために、Amazon の Alexa+ および Echo 担当副社長である Daniel Rausch 氏に話を聞いた。
以下のインタビューは、明瞭さと簡潔さを考慮して編集されています。
Alexa+は3月に早期アクセスとしてリリースされました。それ以来、最も大きな成果は何ですか?
お客様は、Alexa+がより機能的で、より会話的な体験を提供していると感じています。パノス(Amazonデバイス&サービス事業責任者、パナイ)が先ほどおっしゃったように、Alexa+との会話は2倍になっているそうです。私たちは、お客様がAlexa+を通じて、様々なこと、例えば体験全体を通して、より多くのことに関わっていると感じています。
レシピのような機能はちょっとニッチな機能だったと思いますが、パノス氏が言っていたように、5倍に増えましたね。Alexa+は、ただレシピを教えてくれるというだけでなく、料理アシスタントのような存在です。例えば、材料を代用したり、例えばケーキ用小麦粉がないんだけど、何を使えばいい?XかYを使ってみよう、あるいは、グルテンアレルギーの人がいるから、この量のアーモンド粉をその場で代用しよう、といった具合です。
また、Alexaが何ができるか、そしてAlexa自身の専門知識が自身の能力においていかに重要であるかをお客様に教えるという興味深い取り組みも行っています。お客様はすぐに「何ができるの?」「どんな新しいことを知ったの?」といった会話を始め、Alexaもそれについて会話を始めることができます。
AmazonはEchoデバイスなど、家庭内でのAlexa活用に注力しています。今後、Alexaを家庭外にどのように展開していく予定ですか?Echo Framesはしばらく前から発売されていますが、次期モデルはどのようなものですか?
Echo BudsとEcho FramesのAlexa plus体験は既にお客様にご好評いただいており、両製品でAlexaとの関わりがより深くなってきています。チームは現在も忙しく作業を進めておりますので、今後の製品情報にご注目ください。しかし、お客様が家の中でも外でもAlexa+を体験したいと強く望んでいることは、私たちも確信しています。
さて、では、現時点でのスマートグラス市場について、一般的にどうお考えでしょうか?あなたはまさにその分野に先駆的に参入した一人ですからね。
正しく理解する必要があります。ウェアラブル市場について私が言いたいのは、まさにこの点です。顧客について多くのことを覚えておく必要があります。フレームは、ある意味、宝石のようなものですよね?私は中学生の頃から眼鏡をかけています。眼鏡は私のアイデンティティの一部です。鏡で自分の姿を見て、眼鏡をかけていないと、違和感を感じますよね?眼鏡は私の顔の一部なのですから。
イヤホンも同様です。正直なところ、耳の内部構造に関するデータベースを駆使して、あらゆる耳の形状にフィットするよう設計し、綿密な調整が必要です。人体に適した製品を作るのは非常に複雑です。こうした製品は、実際に装着してすぐに、完全にスムーズな体験へと導かなければなりません。
家庭向けのアンビエントAIについてお話ししています。個人的なアンビエント体験についても考えています。背景に溶け込むような、そんな環境が本当に必要です。常にあなたに呼びかけるようなテクノロジーは必要ないですよね。私たちの注意をそらしてしまう、そうでしょう?そうでしょう?
[画面が点灯したばかりのスマートフォンを指差して] 画面が点灯したんです。3人全員がそれを見ているのが見えましたよね? つまり、これは非常に意図的に設計されているということです。パーソナルAI製品を開発する際には、そういったことをすべて念頭に置く必要があると考えています。実際、そうしています。現在の音声体験は、特にフレームとイヤフォン向けに設計されていると確信しています。
しかし、おっしゃる通り、Metaのようにメガネの中にディスプレイが搭載されていると、周囲の環境から切り離され、目の前にいる人々との存在感が薄れてしまうという主張も成り立ちます。今日おっしゃったような理由、つまりテクノロジーが背景に消えていくという観点から、次のステップは音声のみでなければならないとお考えですか?それとも、適切な方法で実装すればディスプレイでも機能するとお考えですか?
私がどう考えているにせよ、お客様が最終的に採用するのは、まさに今この瞬間に留まることができるものでしょう。先ほどもお話ししたように。例えば、家庭用のスマートディスプレイは、間違いなくお客様を今この瞬間に留まらせてくれると確信しています。周囲情報も利用できます。それを実現する方法はいくつかありますが、それは消費者にとっての試練となるでしょう。
発表されたデバイス、Echo Dot Max と Echo Studio についてですが、多くの既存デバイスで Alexa+ を使用できることはわかっていますが、新しいデバイスではプロセッサの機能が向上しているため、Alexa plus のエクスペリエンスはどのように変わるのでしょうか。
いくつか簡単な比較例を挙げてみましょう。部屋内の存在検知は、私が部屋に入ってくる角度がかなり斜めでも、人として認識するまでの速度が3倍速くなりました。また、OmniSenseをローカルで操作すると、前世代のEcho Showと比べて2倍速くなりました。
体験を比較すると、より速く、より正確に私を認識し、誰かが部屋にいることも把握します。私たちが提供できる最もプロアクティブでパーソナライズされた体験をお求めなら、最新のハードウェアが付属しています。
だからといって、古いハードウェアでのAlexa+体験が悪いというわけではありません。素晴らしい体験です。私は自宅で7年間のハードウェアすべてでAlexa+を使っていますが、これらの新しいデバイスは間違いなくAlexa+を体験するのに最適な場所です。
Alexa+ は一部のデバイスでは音声のみですが、画面付きのデバイスでも利用できます。では、そのエクスペリエンスをさまざまなメディアに合わせてどのように調整するのでしょうか?
実際に、返答の長さが異なっているのがわかると思います。今、スマートフォンのAlexa+アプリに音声モードで「エンパイア・ステート・ビルの高さは?」と尋ねると、同じ場所から入力するよりも簡潔な答えが返ってきます。つまり、私たちはユーザー体験と出力の量をカスタマイズしているのです。これは、ユーザーが使用している特定のデバイスに合わせてユーザー体験をカスタマイズする方法の一例にすぎません。
Anthropicとの提携は以前、あるいは現在も継続されていると承知しております。現時点でAlexa+の収益は、Amazonとパートナー各社からそれぞれどれくらいの割合で提供されていますか?それとも、まだ両方の要素が混在しているのでしょうか?
コアとなるのは、非常に高性能で大規模な言語モデルです。Alexa+経由のトラフィックの大部分は、現在もNovaファミリーのモデルが占めていますが、Anthropicのパートナー企業との連携も非常に重要視しています。実際、Alexaとの会話の中で、どのモデルが使われているのかさえ、私には分かりません。
このアーキテクチャには70以上のモデルが稼働しており、複雑な質問への回答を組み立てたり、デバイスに話しかけた非常に複雑で支離滅裂な内容の推論を行ったりと、様々な処理を行っています。これは非常に高度な推論作業負荷と言えるでしょう。そこから、ユーザーとの会話の性質を調整する作業まで、様々な処理が行われます。
これは、フォローアップの質問をすべきかどうかを判断する別のモデルです。「この顧客は今、電気をつけてほしいと頼んだのか?」とか、「今年のスーパーボウルの優勝者は誰だ?」といった質問ではありません。つまり、会話の性質を判断することは、別の種類のワークロード、つまり別のモデルと呼ぶべきものです。
別の意味でのパートナーについて言えば、エージェントAIはサードパーティのサービスに大きく依存しています。数ヶ月前、近所の美味しいピザ屋を探すためにAlexa+を試した時のことを覚えています。近所で実際に一番美味しいピザ屋を探すのではなく、Uber EatsやDoorDashにしか登録されていないピザ屋がデフォルトで表示されてしまいました。
もう一度確認して、結果をお知らせください。私たちが行ったことの一つは、これらの体験を裏付けるために、より広範な地域情報を調整したことです。適切なバランスを見つけ、例えばパートナーサービスと連携する適切なタイミングを見つけることです。
ピザ屋について一般的な質問をされているのですか?それとも、今すぐにテーブルを確保できる場所を探しているのですか?そういったことはモデルが学習しているところで、私たちも早期アクセスを通して学んできました。ですから、次に質問されたときに、どうなっているかぜひ知りたいですね。わかりましたか?そこは間違いなく改善の余地があります。きっと、体験が向上していることを実感していただけると思います。
例えば、地元のピザ屋のような会社がDoorDashやUber Eatsなどに登録していないとします。Alexa+がそのレストランに電話をかけ、ラージサイズのペパロニを注文し、出来上がったらメッセージを送ってくれるようになるのはいつ頃だと思いますか?
今お尋ねいただいたことの最終的な形については、まだお答えできません。私たちが考えているほど遠い未来の話ではないと思います。ただ、今後数週間のうちに、ピザ屋さんに自分で電話をかけられるようになるはずです。つまり、[Alexa+が]「電話をかけましょうか?」と尋ねます。インターフェースをタップするだけで、Alexaがやってきます。これはとても便利です。例えば、一番美味しいピザについて話をしてから、お店が開いているか確認したり、ピザの持ち帰り注文をしたりといったことができます。私も使っていますが、とても便利です。
Tom's Guideのその他の記事
- AmazonイベントLIVE — Alexa+、Echo Studio、カラーKindle Scribe、Fireなど
- Amazonの最新Kindle Scribeはカラースクリーンと薄型ベゼルを誇ります
- 5人家族でAlexa+を試してみた - 結果はこうだった
最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。
マイケル・A・プロスペロは、Tom's Guideの米国版編集長です。彼は、サイトのすべての最新コンテンツと、ホーム、スマートホーム、フィットネス/ウェアラブルのカテゴリーを統括しています。余暇には、最新のドローン、電動スクーター、ビデオドアベルなどのスマートホーム機器のテストも行っています。Tom's Guideに入社する前は、Laptop Magazineのレビュー編集者、Fast Company、Times of Trentonの記者、そして遥か昔にはGeorge誌のインターンを務めていました。ボストン大学で学士号を取得し、大学新聞「The Heights」で働いた後、コロンビア大学ジャーナリズム学部に進学しました。最新のランニングウォッチや電動スクーターを試したり、スキーやマラソンのトレーニングをしていない時は、最新の真空調理器、燻製器、ピザ窯を使って、家族を喜ばせたり、あるいは困惑させたりしているでしょう。