Siri、Googleアシスタント、Cortana –3つのデジタルアシスタントを比較

あなたが90年代に音声ディクテーションソフトウェア(voice dictation software)を試したことを覚えているのに十分な年齢であるなら、あなたは退屈の本当の意味を知っています。自分の声を使ってメールやメモを入力したい場合は、何時間ものトレーニング、非常に遅い発話速度、そして最終的にはかなり役に立たないテキストが必要でした。

今日、物事はこれ以上変わることはありません。機械学習とクラウド(machine learning and cloud)コンピューティング能力の大きな進歩のおかげで、デジタル音声認識(voice recognition)システムは、他の人間とほぼ同じようにあなたを理解することができます。

そのため、デジタルアシスタント(Digital Assistant)が組み込まれたすべてのスマートフォン、ラップトップ、タブレット(laptop and tablet)を出荷できます。3つの主要なプレーヤーは、Appleの(Apple)SiriMicrosoftCortanaGoogleの(Google Assistant)GoogleAssistant(Google)です。名前からわからない場合。

3人のアシスタントはすべて同様の仕事をし、独自の価値提案を提供します。どのアシスタントが「最高」であるかを客観的に言うことはおそらく不可能ですが、特定の一般的なタスクに沿ってそれらを比較することは有用な演習です。これを読んでいるすべての人にとって、これらのアシスタントの1人があなたの特定の状況に最もよくマッチします。 

したがって、この3者間比較の目標は、各オプションの弱点と強みを示して、誰と一緒に行くかについて情報に基づいた選択を行えるようにすることです。ただし、その前に、3人の素敵な出場者を紹介しましょう。

Siri –真のオリジナル(Siri –  A True Original)

Siriは(Siri)iPhone4Sの専用機能として最初に発売されました。iPhone 11が2019年に発売されることを考えてみてください。これにより、 Siri(Siri one)は今日最も古いデジタルアシスタントの1つになっています。 

Siriの最初のティーザーが放映されたとき、それは少しサイエンスフィクション(science fiction)のようです。驚くべき音声合成(voice synthesis)と一見完璧な音声認識(voice recognition)は、本当の目玉でした。振り返ってみると、Siriはある程度の煙、鏡、そして比較的限られた高品質の機能の領域を含んでいました。それ以来、彼女は知性と機能(intelligence and features)でいっぱいになりましたが、一般的な意見は、老婆はもはやテクノロジーリーダー(technology leader)ではないということのようです。 

とにかく、このアシスタントはAppleエコシステム(Apple ecosystem)に限定されているので、より大きな問題は、Apple愛好家(Apple aficionados)が彼らのデバイスが同梱されて いるストアブランドのアシスタント(store-brand assistant)に固執するべきかどうかということです。

Cortana –ゲームの女神からパーソナルアシスタントまで(Cortana – From Game Goddess To Personal Assistant)

Cortanaは、Bungieの世界的に有名な(Cortana)Haloシリーズ(Halo series)のゲームのキャラクターにちなんで名付けられました。彼女は、ゲームシリーズ(game series)のヒーローであるマスターチーフ(Master Chief)を支援するAIです。今、あなたも彼女の象徴的な(voice talk)を頭の中で話すことができます。それは、フルサイズのHaloマスターチーフコレクター(Halo Master Chief collector)のヘルメットと一緒にヘッドフォンを着用する場合です。

Microsoftのモバイルオペレーティングシステム(operating system)は事実上もはや存在しないため、Cortanaは主にWindows 10の機能であり、 (Windows 10)AndroidストアとiOSストア(Android and iOS stores)の両方にアプリがあります。これは、彼女がいくつかの優れたWindows統合(Windows integration)機能を提供していることを意味しますが、もちろん、人々が実際に使用しているモバイルシステムにはネイティブではありません。

Googleアシスタント–チューリングテストに参加(Google Assistant – Taking On The Turing Test)

Googleは間違いなく世界のトップテクノロジー企業の1つです。特に高度なAIアルゴリズム(AI algorithms)に関しては。したがって、Googleアシスタント(Google Assistant)が最新のテクノロジーで鰓に詰め込まれているのは当然のことです。 

いくつかの点で、これは少し問題になる可能性があります。機能セットは絶えず変化しており、 Googleアシスタント(Google Assistant)がどこで終了し、他のGoogleサービスがどこから始まるかが常に明確であるとは限りません。

たとえば、Google Duplexは非常に印象的なサービスであり、GoogleのAIチャットボット(AI chatbot)が(たとえば)地元の美容師に電話をかけて予約を取ります。あなたがしなければならないのは尋ねるだけです。ただし、Duplexは独自のプロジェクトとして開発され、拡張機能としてアシスタントに組み込まれました。(Assistant)

Googleアシスタント(Google Assistant)を使用する利点は、 Androidとの優れた統合を含む(Android)Googleサービスと緊密に統合されていることです。

テスト方法(How We Tested)

この比較の背後にある考え方は、これら3人のアシスタントを紙の仕様に従って比較することではありません。代わりに、実際に日常的にどのように使用するかという観点から、実際にそれらを比較するというアイデアがあります。

ここで重要なのは、ユーザーエクスペリエンスと、これらの優れたボットが実際にあなたが望むことを実行するかどうかです。特定のアシスタント(specific assistant)が特定のユースケースに対応する(use case)キラー機能(killer feature)を備えている場合、とにかくこれはすべて意味がありません。

ここでは、2つの別々のデバイスを使用して、問題の3つのデジタルアシスタントをテストしました。Siriの場合、執筆時点で最新バージョンのiOS12を搭載したiPadPro9.7インチ(Pro 9.7)タブレット(” tablet)を使用しました。他の2つのデバイスには、Samsung Galaxy Note 10+を使用しました。

日常の使用感をつかむことが目的であるため、インターネット検索(internet search)カレンダーリマインダー(calendar reminder)の作成、アプリケーションの起動など、それぞれにまったく同じ一般的なタスクが与えられました。

音声合成の品質(Voice Synthesis Quality)

難しい技術仕様ではないかもしれませんが、デジタルアシスタントは、話すときの自然な音によって生きたり死んだりします。これらのアプリケーションの要点は、ユーザーを会話型インターフェースに移行することです。これ(Which)は、耳障りなロボットの(voice isn)は受け入れられず、ほとんどの人がそのような製品を使用することを思いとどまらせることを意味します。

これら3つのテストでは、Googleアシスタント(Google Assistant)が一番上に出ており、Siriが2番目、Cortanaがかなり遠い3番目です。GoogleとAppleの製品はどちらも、少なくとも北米英語の(English)反復では自然に聞こえますが、貧弱なCortanaはアップグレードが必要なようです。

フレーズ反応のパフォーマンスをトリガーする(Trigger Phrase Reaction Performance)

最新のデジタルアシスタント(digital assistant)の大きな特徴の1つは、ハンズフリーでの使用です。あなたがしなければならないのは魔法の言葉を言うことだけであり、アシスタントは助ける準備ができています。少なくとも理論的には。そこで、トリガーワード(trigger word)がどれだけうまく反応した かを見たかったのです。

(Please note)iOSの場合、ハンズフリートリガーをサポートしているのはSiriのみであることに(Siri)注意してください。iOSにはCortanaとGoogleアシスタント(Cortana and Google Assistant)の両方をインストールできますが、一言で起動することはできません。ここでの最も簡単な回避策は、Siriに他のアシスタントを起動するように依頼することです。奇妙なことですが、どうしても必要な場合は、数秒の余分な作業が追加されます。

AppleのSiri(Siri)から始めましょう。「HeySiri(Siri)トリガーフレーズ(trigger phrase)の使用は瞬時に行われ、質問をする前にプロンプ​​トを待つ必要はありません。Googleアシスタント(Google Assistant)も同様に機能しますが、デフォルトではこのように動作しません。少なくともGoogle以外の電話では。メニューには、謎めいた名前の「Voice Match」設定を見つけるためのかなりの掘り下げがあります。これにより、ロックされている場合でも、携帯電話のどこからでもデジタル魔神を呼び出すことができます。

Cortanaのアプリは、アプリが開いているときにのみ(only )トリガーワード(trigger word)に応答します。ですから、正直に言うとそれほど有用ではありません。

退屈だが便利なもの(The Boring But Useful Stuff)

リマインダーの設定、Webページのオープン、アプリの起動、およびその他の同様のタスクは、デジタルアシスタントを使用する上での基本です(bread and butter)では、これら3つの運賃はどうですか?

Web検索を行う場合、3人のアシスタントはすべて完全に問題ありません。CortanaBingを使用していますが、これはGoogleのアルゴリズムを好む人にとっては良いことではないかもしれません。3人全員が、リマインダーを設定し、メモを取り、予定をカレンダーに入れて喜んでいました。

iOSでは、 Siriはaplombを使用してアプリを起動し、AppleMusicサービス(the Apple Music service)を使用して音楽を再生できます。Androidでは、Googleアシスタントもアプリの起動リクエストに問題なく準拠してい(Google Assistant)ます(YouTube Music)が、奇妙なことにYouTubeMusicでは正しく機能しません。これはうまくいけばすぐに修正されるでしょう。Cortanaは、アプリを起動したり、アプリバブル全体の外に出たりすることを拒否します。(apps or step)

コルタナ(Cortana)が私たちのために行うのはそれだけです。それほど(Which)多くはありません。

デバイスの統合と制御(Device Integration & Control)

デジタル(Digital)アシスタントは、適切な権限にアクセスできる場合、デバイスをハンズフリーで操作するのに最適です。Siriの最新バージョンでは、彼女が常駐するAppleデバイス(Apple device)をほぼ完全に制御できます。彼女は、 WiFiやBluetooth(WiFi or Bluetooth)のオンとオフを切り替えるなど、多数のトグルを管理できます。Siriを使用してVoiceOverなどのユーザー補助機能をアクティブにすることもできます。

Androidでは、Googleアシスタント(Google Assistant)も同様に機能し、ビートをスキップせずに一般的な設定を切り替えました。ただし、 Cortana(Cortana)は管理できませんでした。これは、現時点ではそれほど驚くことではありません。

非言語的使用(Nonverbal Use)

これらのデバイスの大きなショーケース機能(showcase feature)は、物事を成し遂げるために単にそれらに話しかけることができるという事実ですが、デジタルアシスタントと大声で会話することが常に可能または望ましいとは限りません。あなたはバスに乗っているかもしれませんし、会議にいるか、静かに過ごしたい他の場所にいるかもしれません。 

最近のほとんどのアシスタントには、会話をオフエアにすることができるテキストチャットモードがありますが、それでも自然言語の応答を得ることができます。(text chat mode)

ただし、Siriはデフォルトではこれを行いません。iOSのアクセシビリティメニューに移動し、TypetoSiriをアクティブ(accessibility menu and activate) (Type to Siri)する必要があります。CortanaとGoogleアシスタント(Cortana and Google Assistant)はどちらもデフォルトでテキスト入力(text input)を利用できるため、ここで少量の追加クレジットを取得します。

音声認識性能(Voice Recognition Performance)

デジタルアシスタントはあなたをどれだけよく理解(assistant understand)できますか?この質問には2つの部分があります。1つ目は、音声をテキストに正確に変換することです。あなたの言うことがオートコレクトのような文字化けした混乱に変わるなら、それはあまり役に立ちません。質問の2番目の部分は、あなたが言ったことがソフトウェアによってどれだけうまく解析されるかに関係しています。 

3人のアシスタント全員が、私たちが言ったことを問題なく理解し、正しく解析しました。ここで報告することはあまりありませんが、2019年の音声認識とAI(voice recognition and AI)はかなり印象的です。

評決–誰がトップに立ったのか?(The Verdict –  Who Came Out on Top?)

Appleユーザーにとって、評決は明確です。Siriは、(Siri)最先端のテクノロジー(cutting-edge technology)の点でGoogleアシスタント(Google Assistant)に客観的に遅れをとっていますが、iOSおよびAppleハードウェア(s hardware)との緊密な統合により、全体的に最高のエクスペリエンスを提供します。

特にその事実上完璧なハンズフリーパフォーマンスを考えると。Apple Musicなどの(Apple Music)Appleサービスも使用していて、 Siriショートカットの微調整に時間を費やしている場合、iOSデバイスで他のデジタルアシスタントがもたらす制限やフープに我慢することは想像できません。

とにかくSiri(Siri)にアクセスできないAndroidユーザーにとって、物事はもっと面白くなります。Galaxy Note 10+テストデバイスの(test device)CortanaとGoogleアシスタントの間(Between Cortana and Google Assistant)では、Googleアシスタント(Google Assistant)が明らかに優位に立っています。Cortanaが検索エンジン(search engine)としてBingを使用していることは理解できますが、Bingは一貫して満足のいく検索結果を提供していませんでした。これは、それに対してかなり深刻な点です。 

ただし、最終的には、Cortanaは(Cortana)Android上で非常に限定されたアプリケーションです。Windows上のCortanaとの相互機能により、便利な追加アプリになる可能性がありますが、 Googleアシスタント(Google Assistant)がすぐそこにあり、そのまま統合されている場合は、メインのAndroidアシスタント(Android assistant)として推奨することはできません。



About the author

私は、Windows 11 または 10 アプリケーションの開発と保守に 10 年以上の経験を持つソフトウェア エンジニアです。また、Google ドキュメントと Microsoft Edge の使用経験もあります。これらの分野での私のスキルは、将来のソフトウェア エンジニアリングの役割の優れた候補者になります。



Related posts