あなたが90年代に音声ディクテーションソフトウェア(voice dictation software)を試したことを覚えているのに十分な年齢であるなら、あなたは退屈の本当の意味を知っています。自分の声を使ってメールやメモを入力したい場合は、何時間ものトレーニング、非常に遅い発話速度、そして最終的にはかなり役に立たないテキストが必要でした。
今日、物事はこれ以上変わることはありません。機械学習とクラウド(machine learning and cloud)コンピューティング能力の大きな進歩のおかげで、デジタル音声認識(voice recognition)システムは、他の人間とほぼ同じようにあなたを理解することができます。
そのため、デジタルアシスタント(Digital Assistant)が組み込まれたすべてのスマートフォン、ラップトップ、タブレット(laptop and tablet)を出荷できます。3つの主要なプレーヤーは、Appleの(Apple)Siri、MicrosoftのCortana、Googleの(Google Assistant)GoogleAssistant(Google)です。名前からわからない場合。
3人のアシスタントはすべて同様の仕事をし、独自の価値提案を提供します。どのアシスタントが「最高」であるかを客観的に言うことはおそらく不可能ですが、特定の一般的なタスクに沿ってそれらを比較することは有用な演習です。これを読んでいるすべての人にとって、これらのアシスタントの1人があなたの特定の状況に最もよくマッチします。
したがって、この3者間比較の目標は、各オプションの弱点と強みを示して、誰と一緒に行くかについて情報に基づいた選択を行えるようにすることです。ただし、その前に、3人の素敵な出場者を紹介しましょう。
Siri –真のオリジナル(Siri – A True Original)
Siriは(Siri)iPhone4Sの専用機能として最初に発売されました。iPhone 11が2019年に発売されることを考えてみてください。これにより、 Siri(Siri one)は今日最も古いデジタルアシスタントの1つになっています。
Siriの最初のティーザーが放映されたとき、それは少しサイエンスフィクション(science fiction)のようです。驚くべき音声合成(voice synthesis)と一見完璧な音声認識(voice recognition)は、本当の目玉でした。振り返ってみると、Siriはある程度の煙、鏡、そして比較的限られた高品質の機能の領域を含んでいました。それ以来、彼女は知性と機能(intelligence and features)でいっぱいになりましたが、一般的な意見は、老婆はもはやテクノロジーリーダー(technology leader)ではないということのようです。
とにかく、このアシスタントはAppleエコシステム(Apple ecosystem)に限定されているので、より大きな問題は、Apple愛好家(Apple aficionados)が彼らのデバイスが同梱されて いるストアブランドのアシスタント(store-brand assistant)に固執するべきかどうかということです。
Cortana –ゲームの女神からパーソナルアシスタントまで(Cortana – From Game Goddess To Personal Assistant)
Cortanaは、Bungieの世界的に有名な(Cortana)Haloシリーズ(Halo series)のゲームのキャラクターにちなんで名付けられました。彼女は、ゲームシリーズ(game series)のヒーローであるマスターチーフ(Master Chief)を支援するAIです。今、あなたも彼女の象徴的な声(voice talk)を頭の中で話すことができます。それは、フルサイズのHaloマスターチーフコレクター(Halo Master Chief collector)のヘルメットと一緒にヘッドフォンを着用する場合です。
Microsoftのモバイルオペレーティングシステム(operating system)は事実上もはや存在しないため、Cortanaは主にWindows 10の機能であり、 (Windows 10)AndroidストアとiOSストア(Android and iOS stores)の両方にアプリがあります。これは、彼女がいくつかの優れたWindows統合(Windows integration)機能を提供していることを意味しますが、もちろん、人々が実際に使用しているモバイルシステムにはネイティブではありません。
Googleアシスタント–チューリングテストに参加(Google Assistant – Taking On The Turing Test)
Googleは間違いなく世界のトップテクノロジー企業の1つです。特に高度なAIアルゴリズム(AI algorithms)に関しては。したがって、Googleアシスタント(Google Assistant)が最新のテクノロジーで鰓に詰め込まれているのは当然のことです。
いくつかの点で、これは少し問題になる可能性があります。機能セットは絶えず変化しており、 Googleアシスタント(Google Assistant)がどこで終了し、他のGoogleサービスがどこから始まるかが常に明確であるとは限りません。
たとえば、Google Duplexは非常に印象的なサービスであり、GoogleのAIチャットボット(AI chatbot)が(たとえば)地元の美容師に電話をかけて予約を取ります。あなたがしなければならないのは尋ねるだけです。ただし、Duplexは独自のプロジェクトとして開発され、拡張機能としてアシスタントに組み込まれました。(Assistant)
Googleアシスタント(Google Assistant)を使用する利点は、 Androidとの優れた統合を含む(Android)Googleサービスと緊密に統合されていることです。
テスト方法(How We Tested)
この比較の背後にある考え方は、これら3人のアシスタントを紙の仕様に従って比較することではありません。代わりに、実際に日常的にどのように使用するかという観点から、実際にそれらを比較するというアイデアがあります。
ここで重要なのは、ユーザーエクスペリエンスと、これらの優れたボットが実際にあなたが望むことを実行するかどうかです。特定のアシスタント(specific assistant)が特定のユースケースに対応する(use case)キラー機能(killer feature)を備えている場合、とにかくこれはすべて意味がありません。
ここでは、2つの別々のデバイスを使用して、問題の3つのデジタルアシスタントをテストしました。Siriの場合、執筆時点で最新バージョンのiOS12を搭載したiPadPro9.7インチ(Pro 9.7)タブレット(” tablet)を使用しました。他の2つのデバイスには、Samsung Galaxy Note 10+を使用しました。
日常の使用感をつかむことが目的であるため、インターネット検索(internet search)、カレンダーリマインダー(calendar reminder)の作成、アプリケーションの起動など、それぞれにまったく同じ一般的なタスクが与えられました。
音声合成の品質(Voice Synthesis Quality)
難しい技術仕様ではないかもしれませんが、デジタルアシスタントは、話すときの自然な音によって生きたり死んだりします。これらのアプリケーションの要点は、ユーザーを会話型インターフェースに移行することです。これ(Which)は、耳障りなロボットの声(voice isn)は受け入れられず、ほとんどの人がそのような製品を使用することを思いとどまらせることを意味します。
これら3つのテストでは、Googleアシスタント(Google Assistant)が一番上に出ており、Siriが2番目、Cortanaがかなり遠い3番目です。GoogleとAppleの製品はどちらも、少なくとも北米英語の(English)反復では自然に聞こえますが、貧弱なCortanaはアップグレードが必要なようです。
フレーズ反応のパフォーマンスをトリガーする(Trigger Phrase Reaction Performance)
最新のデジタルアシスタント(digital assistant)の大きな特徴の1つは、ハンズフリーでの使用です。あなたがしなければならないのは魔法の言葉を言うことだけであり、アシスタントは助ける準備ができています。少なくとも理論的には。そこで、トリガーワード(trigger word)がどれだけうまく反応した かを見たかったのです。
(Please note)iOSの場合、ハンズフリートリガーをサポートしているのはSiriのみであることに(Siri)注意してください。iOSにはCortanaとGoogleアシスタント(Cortana and Google Assistant)の両方をインストールできますが、一言で起動することはできません。ここでの最も簡単な回避策は、Siriに他のアシスタントを起動するように依頼することです。奇妙なことですが、どうしても必要な場合は、数秒の余分な作業が追加されます。
AppleのSiri(Siri)から始めましょう。「HeySiri(Siri)」トリガーフレーズ(trigger phrase)の使用は瞬時に行われ、質問をする前にプロンプトを待つ必要はありません。Googleアシスタント(Google Assistant)も同様に機能しますが、デフォルトではこのように動作しません。少なくともGoogle以外の電話では。メニューには、謎めいた名前の「Voice Match」設定を見つけるためのかなりの掘り下げがあります。これにより、ロックされている場合でも、携帯電話のどこからでもデジタル魔神を呼び出すことができます。
Cortanaのアプリは、アプリが開いているときにのみ(only )トリガーワード(trigger word)に応答します。ですから、正直に言うとそれほど有用ではありません。
退屈だが便利なもの(The Boring But Useful Stuff)
リマインダーの設定、Webページのオープン、アプリの起動、およびその他の同様のタスクは、デジタルアシスタントを使用する上での基本です。(bread and butter)では、これら3つの運賃はどうですか?
Web検索を行う場合、3人のアシスタントはすべて完全に問題ありません。CortanaはBingを使用していますが、これはGoogleのアルゴリズムを好む人にとっては良いことではないかもしれません。3人全員が、リマインダーを設定し、メモを取り、予定をカレンダーに入れて喜んでいました。
iOSでは、 Siriはaplombを使用してアプリを起動し、AppleMusicサービス(the Apple Music service)を使用して音楽を再生できます。Androidでは、Googleアシスタントもアプリの起動リクエストに問題なく準拠してい(Google Assistant)ます(YouTube Music)が、奇妙なことにYouTubeMusicでは正しく機能しません。これはうまくいけばすぐに修正されるでしょう。Cortanaは、アプリを起動したり、アプリバブル全体の外に出たりすることを拒否します。(apps or step)
コルタナ(Cortana)が私たちのために行うのはそれだけです。それほど(Which)多くはありません。
デバイスの統合と制御(Device Integration & Control)
デジタル(Digital)アシスタントは、適切な権限にアクセスできる場合、デバイスをハンズフリーで操作するのに最適です。Siriの最新バージョンでは、彼女が常駐するAppleデバイス(Apple device)をほぼ完全に制御できます。彼女は、 WiFiやBluetooth(WiFi or Bluetooth)のオンとオフを切り替えるなど、多数のトグルを管理できます。Siriを使用してVoiceOverなどのユーザー補助機能をアクティブにすることもできます。
Androidでは、Googleアシスタント(Google Assistant)も同様に機能し、ビートをスキップせずに一般的な設定を切り替えました。ただし、 Cortana(Cortana)は管理できませんでした。これは、現時点ではそれほど驚くことではありません。
非言語的使用(Nonverbal Use)
これらのデバイスの大きなショーケース機能(showcase feature)は、物事を成し遂げるために単にそれらに話しかけることができるという事実ですが、デジタルアシスタントと大声で会話することが常に可能または望ましいとは限りません。あなたはバスに乗っているかもしれませんし、会議にいるか、静かに過ごしたい他の場所にいるかもしれません。
最近のほとんどのアシスタントには、会話をオフエアにすることができるテキストチャットモードがありますが、それでも自然言語の応答を得ることができます。(text chat mode)
ただし、Siriはデフォルトではこれを行いません。iOSのアクセシビリティメニューに移動し、TypetoSiriをアクティブ(accessibility menu and activate) に(Type to Siri)する必要があります。CortanaとGoogleアシスタント(Cortana and Google Assistant)はどちらもデフォルトでテキスト入力(text input)を利用できるため、ここで少量の追加クレジットを取得します。
音声認識性能(Voice Recognition Performance)
デジタルアシスタントはあなたをどれだけよく理解(assistant understand)できますか?この質問には2つの部分があります。1つ目は、音声をテキストに正確に変換することです。あなたの言うことがオートコレクトのような文字化けした混乱に変わるなら、それはあまり役に立ちません。質問の2番目の部分は、あなたが言ったことがソフトウェアによってどれだけうまく解析されるかに関係しています。
3人のアシスタント全員が、私たちが言ったことを問題なく理解し、正しく解析しました。ここで報告することはあまりありませんが、2019年の音声認識とAI(voice recognition and AI)はかなり印象的です。
評決–誰がトップに立ったのか?(The Verdict – Who Came Out on Top?)
Appleユーザーにとって、評決は明確です。Siriは、(Siri)最先端のテクノロジー(cutting-edge technology)の点でGoogleアシスタント(Google Assistant)に客観的に遅れをとっていますが、iOSおよびAppleのハードウェア(s hardware)との緊密な統合により、全体的に最高のエクスペリエンスを提供します。
特にその事実上完璧なハンズフリーパフォーマンスを考えると。Apple Musicなどの(Apple Music)Appleサービスも使用していて、 Siriショートカットの微調整に時間を費やしている場合、iOSデバイスで他のデジタルアシスタントがもたらす制限やフープに我慢することは想像できません。
とにかくSiri(Siri)にアクセスできないAndroidユーザーにとって、物事はもっと面白くなります。Galaxy Note 10+テストデバイスの(test device)CortanaとGoogleアシスタントの間(Between Cortana and Google Assistant)では、Googleアシスタント(Google Assistant)が明らかに優位に立っています。Cortanaが検索エンジン(search engine)としてBingを使用していることは理解できますが、Bingは一貫して満足のいく検索結果を提供していませんでした。これは、それに対してかなり深刻な点です。
ただし、最終的には、Cortanaは(Cortana)Android上で非常に限定されたアプリケーションです。Windows上のCortanaとの相互機能により、便利な追加アプリになる可能性がありますが、 Googleアシスタント(Google Assistant)がすぐそこにあり、そのまま統合されている場合は、メインのAndroidアシスタント(Android assistant)として推奨することはできません。
Siri, Google Assistant, & Cortana – Three Digital Assistants Compared
If you’re оld еnough to remember trying voice dictatiоn software in the 90ѕ, thеn уou know the true meaning of tedium. If you wanted to type out an email or a memo using your voice, it required hourѕ of training, a painfully slow speaking speed and ultimately a pretty useless piece of text.
Today things couldn’t be more different. Thanks to major advances in machine learning and cloud computing power, digital voice recognition systems can understand you nearly as well as another human being.
Which is why it’s possible to ship every smartphone, laptop and tablet with a built-in Digital Assistant. The three main players are Siri from Apple, Cortana from Microsoft and Google Assistant, from, well, Google. In case it isn’t apparent from the name.
All three assistants perform similar jobs and also have their own unique value propositions to offer. It’s probably impossible to objectively say which assistant is the “best”, but comparing them along specific common tasks is a useful exercise. For every person reading this, one of these assistants is the best match to your specific circumstances.
So for this three-way comparison the goal will be to showcase the weaknesses and strengths of each option so that you can make an informed choice about who to go with. Before we do that however, let’s introduce our three lovely contestants.
Siri – A True Original
Siri first launched as an exclusive feature of the iPhone 4S. Consider that the iPhone 11 is launching in 2019, that makes Siri one of the oldest digital assistants today.
When the first teasers for Siri were aired, it seems a little like science fiction. Amazing voice synthesis and seemingly flawless voice recognition were real showstoppers. In retrospect, Siri involved some measure of smoke, mirrors and a relatively limited domain of high-quality functions. Since then she’s bulked up with intelligence and features, but the popular opinion seems to be that the old girl is no longer the technology leader.
Regardless, this assistant is limited to the Apple ecosystem so the greater question is whether Apple aficionados should stick with the store-brand assistant their devices ship with or not.
Cortana – From Game Goddess To Personal Assistant
Cortana is named after the character from Bungie’s world-famous Halo series of games. She’s the AI that assists the Master Chief, the hero of the game series. Now you too can have her iconic voice talk in your head. Well, that is if you wear headphones along with that full-size Halo Master Chief collector’s helmet.
Since Microsoft’s mobile operating system is effectively no more, Cortana is mainly a Windows 10 feature, with apps on both Android and iOS stores. This means she offers some great Windows integration features, but is of course not native to any mobile system people are actually using.
Google Assistant – Taking On The Turing Test
Google is undoubtedly one of the top technology companies in the world. Especially when it comes to advanced AI algorithms. So it should be no surprise that the Google Assistant is stuffed to the gills with the latest technology.
In some ways this can be a bit of a problem. The feature set is constantly shifting and it’s not always clear where Google Assistant ends and other Google services begin.
For example, Google Duplex is an incredibly impressive service where Google’s AI chatbot will phone (for example) the local hairdresser and make an appointment for you. All you have to do is ask. However, Duplex was developed as its own project and then rolled into the Assistant as an extension.
The upside of using Google Assistant is that it’s tightly integrated with Google services, which includes great integration with Android.
How We Tested
The idea behind this comparison is not to compare these three assistants according to their on-paper specifications. Instead the idea is to compare them, hands-on in terms of how you’d actually use them on a daily basis.
What matters here is the user experience and whether these brilliant bots actually do what you want them to. If a specific assistant has a killer feature for your specific use case, then this is all moot anyway.
We used two separate devices to test the three digital assistants in question here. In the case of Siri we used an iPad Pro 9.7” tablet, with the latest version of iOS 12 at the time of writing. For the other two devices, we used a Samsung Galaxy Note 10+.
Since the idea is to get a feel for day-to-day use, each one was given exactly the same common tasks, which include doing an internet search, creating a calendar reminder and starting an application.
Voice Synthesis Quality
It might not be a hard technical specification, but a digital assistant lives and dies by how natural it sounds when speaking. The whole point of these applications is to shift the user over to a conversational interface. Which means a jarring, robotic voice isn’t acceptable and would put most people off from using such a product.
In our testing of these three, it’s the Google Assistant that comes out on top, with Siri second and Cortana a rather distant third. Both Google and Apple’s products sound natural, at least in their North American English iterations, but poor Cortana sounds like she needs an upgrade.
Trigger Phrase Reaction Performance
One of the big features of any modern digital assistant is hands-free use. All you have to do is say the magic word and the assistant is ready to help. At least in theory. So we wanted to see how well the trigger word was reacted to.
Please note that in the case of iOS, only Siri supports hands-free triggering. Although you can install both Cortana and Google Assistant on iOS, you can’t launch them with just a word. The simplest workaround here is to ask Siri to launch the other assistant. It’s weird, but if you absolutely need to, this adds just a few seconds of extra work.
Let’s start with Apple’s Siri. Using the “Hey Siri” trigger phrase is instant and you don’t have to wait for a prompt before asking your question. Google Assistant performs just as well, but it doesn’t behave this way by default. At least not on non-Google phones. There’s quite a bit of digging in the menu to finding the cryptically-named “Voice Match” setting, which lets you summon the digital genie from anywhere on your phone, even if its locked.
Cortana’s app only responds to the trigger word when the app is open. So not all that useful to be honest.
The Boring But Useful Stuff
Setting reminders, opening webpages, starting apps and other similar tasks are the bread and butter of using a digital assistant. So how do these three fare?
When it comes to doing web searches, all three assistants are perfectly fine. Cortana uses Bing, which might not be a good thing for people who prefer Google’s algorithms. All three were happy to set reminders, take memos and put appointments on the calendar.
On iOS Siri launches apps with aplomb and is happy to play music using the Apple Music service. On Android, Google Assistant also happily complies with app launch requests, but strangely doesn’t work properly with YouTube Music. This will hopefully be fixed soon. Cortana flat out refuses to launch any apps or step outside her app bubble as a whole.
That’s all Cortana would do for us. Which is not much at all.
Device Integration & Control
Digital assistants are great for hands-free operation of your device if they can access the right permissions. The latest version of Siri has almost complete control of the Apple device she resides on. She can manage a large number of toggles, such as flipping WiFi or Bluetooth on or off. You can activate accessibility features such as VoiceOver using Siri as well.
On Android, Google Assistant did just as well, toggling common settings without skipping a beat. Cortana was however unable to manage, which is not too surprising at this point.
Nonverbal Use
While the big showcase feature of these devices is the fact that you can simply talk at them to get things done, it’s not always possible or desirable to have a loud conversation with your digital assistant. You may be on the bus, in a meeting or some other place where you’d rather stay quiet.
These days most assistants have a text chat mode where you can take the conversation off the air, but still get natural language responses.
Siri does not do this by default however – you have to go to the iOS accessibility menu and activate Type to Siri. Both Cortana and Google Assistant had text input available by default, so they get a small amount of extra credit here.
Voice Recognition Performance
How well can a digital assistant understand you? There are two parts to this question. The first has to do with accurate conversion of your speech to text. It’s not much use if what you say turns into an autocorrect-like garbled mess. The second part of the question has to do with how well what you’ve said is parsed by the software.
All three assistants understood what we said with no problem and parsed it correctly. Not much to report here but that voice recognition and AI in 2019 is pretty impressive.
The Verdict – Who Came Out on Top?
For Apple users, the verdict is clear. Although Siri objectively lags behind Google Assistant in terms of cutting-edge technology, its deep integration with iOS and Apple’s hardware means it provides the best overall experience.
Especially given its virtually flawless hands-free performance. If you also use Apple services such as Apple Music and spend some time fine-tuning Siri shortcuts, then it’s hard to imagine putting up with the limitations and hoops other digital assistants pose on iOS devices.
For Android users, who don’t have access to Siri anyway, things get more interesting. Between Cortana and Google Assistant on our Galaxy Note 10+ test device, Google Assistant clearly has the upper hand. Cortana’s use of Bing as its search engine is understandable, but Bing consistently gave less satisfactory search results, which is a rather serious mark against it.
In the end however, Cortana is a very limited application on Android. The cross-functionality that exists with Cortana on Windows might make it a useful additional app, but it can’t be recommended as your primary Android assistant when Google Assistant is right there and as well-integrated as it is.