音声認識の操作:コマンド、テキストのディクテーション、およびWebの閲覧

Windows7音声認識ソフトウェア(speech recognition software)は驚くほど洗練されています。Microsoftは、かつては高価なサードパーティの(Microsoft)音声認識ソフトウェア(speech recognition software)でしか利用できなかった多くの機能を組み込んでいました。音声認識(Speech Recognition)は使いやすいですが、すべての洗練されたソフトウェアと同様に、友人と話すのと同じくらい流暢にコンピュータと話す前に、いくつかの基本を学ぶ必要があります。基本には、音声認識(Speech Recognition)の開始方法、一般的なコマンド、テキストの入力、修正、およびWebの閲覧が含まれます。

前回の記事(音声認識(Speech Recognition)の操作:セットアップと構成)では、(Setup and Configuration)音声認識(Speech Recognition)で成功するための機器のセットアップについて説明しました。ここでは、 Microsoft(Microsoft)の組み込みチュートリアルを含む手順を実行し、準備ができていることを前提としています。

注:(NOTE:)音声認識(Speech Recognition)でできることすべてについて話すつもりはありません。そのため、本を書かなければなりません。しかし、私は最も一般的な使用法、書き込みとブラウジングについて説明します。

音声認識の開始

始める前に、画面上で開いている他のすべてのアプリケーションを閉じます。(これは学習を目的としています。音声認識(Speech Recognition)の仕組みを理解したら、必要な数のアプリケーションを開くことができます。また、コンピューターに話しかけて、他のアプリケーションに切り替えるように指示することもできます。 )。

[スタートメニュー](Start Menu)検索ボックスに音声(speech)を入力し、 [音声認識(Speech Recognition)]を選択して話し始めるだけですが、この場合、長い道のり(way round)を歩むのには非常に理由があります。Control Panel -> Ease of Access -> Speech Recognition](Speech Recognition)クリックします。

音声認識

ご覧のとおり、このほとんどはすでに処理済みです。スキップ(Skip)して、コンピュータをトレーニングして理解を深め(Train your computer to better understand you)(これについては、トラブルシューティングについて説明する次の記事で扱います)、[音声参照カードを開く(Open the Speech Reference Card)]をクリックします。

音声認識

これにより、探索するヘルプトピックのインデックスが提供されます。今のところ、一般的な音声認識コマンド(Common speech recognition commands)をクリックします。

音声認識

最も一般的に使用されるコマンドの優れたチャートと、それらをアクティブ化するために何を言う必要があるかが表示されます。音声認識(Speech Recognition)の仕組みを学習している間、手元に置いておくために、これを印刷することをお勧めします。

音声認識

リストはここにもあります:音声認識の一般的なコマンド(Common commands in Speech Recognition)

これで準備が整いました。[音声認識の開始]を(Start speech recognition)クリックします。画面の上部に音声認識(Speech Recognition)ガジェットが表示され、アクティブであることを知らせるチャープ音が鳴ります。ただし、デフォルトでは、指示するまで「聞いている」わけではありません。

音声認識

注意:(A reminder:)音声認識(Speech Recognition)ガジェットが上部にある空白のデスクトップが必要です。

次に、マイクが接続されていることを確認し、バックグラウンドノイズ(background noise)ができるだけ少ないことを確認して、「聞き始めて」と言います。("Start listening.")ガジェットがこれを思い出させるのに役立つことがわかります。

音声認識

これは、音声認識(Speech Recognition)がアイドリング時に「聞こえる」唯一のフレーズです。他に何もそれを目覚めさせません。必要に応じて、音声認識(Speech Recognition)に聞きたいことを伝える前に、これを試すことができます。次に、「聞き始めて」("Start listening")と言うと、試してみる準備が整います。

音声認識

音声認識による(Speech Recognition)テキスト(Text)のディクテーション

音声認識(Speech Recognition)プログラムがアクティブになったので、それを使って何ができますか?覚えておくべきことがいくつかあります。アクティブに実行されているアプリケーションがない場合、現時点でできることはあまりありません。「スタート」("Start")と言ってスタートメニュー(Start Menu)を開きます。音声認識(Speech Recognition)Microsoft製品(Microsoft product)であるため、他のMicrosoft製品(Microsoft product)で最もうまく機能します。それでは、(So let)実験するメモ帳(Notepad)を選んでみましょう。

メモ帳(Notepad)の起動方法は、スタートメニュー(Start Menu)の設定方法によって異なります。メモ帳が(Notepad)スタートメニュー(Start Menu)を開いたときに表示される項目である場合は、 「メモ帳」("Notepad.")とだけ言ってください。そこにない場合は、「すべてのプログラム」("All programs,")「アクセサリ」("Accessories,")「メモ帳」の順に言います。メモ帳("Notepad." Notepad)が開いていて、すぐに使用できます。

それで?話し始めてください。ここでは、おなじみのフレーズを試してみます。私はそれを通常の会話のトーンと通常の速度で話します。

音声認識

待ってください(Wait)、そうではありません。句読点や大文字小文字(punctuation or capitalization)の区別はなく、2つの単語が間違っています。どうすれば修正できますか?

コマンドselectを使用して、問題のある各単語を選択します。ここでは、 「友達を選ぶ」("Select friends." )と言いました。

音声認識

その言葉の何が問題になっていますか?あるべきであるように、その後にコンマはありません。したがって、「友達」を選択した後、 ("Friends")「友達コンマ」("Friends comma.")と言います。Upは、可能な選択肢のリストを含むウィンドウをポップアップします

音声認識

最初の項目を選択するために「1つ」("One")と言い、次にそれを承認するために「OK」と言います。("OK")

音声認識

文を読み進めながら、「romans」を選択して「Romanscomma」と言います。("Romans comma.")Upが再びボックスをポップアップし、もう一度必要なアイテムを選択します。

音声認識

「countrymen」「ears」を選択し、単語をより明確に話し、正しいスペルを選択することで、スペルを修正します。「耳」("ears")が終わったら、「感嘆符("exclamation point.")」と言います。

音声認識

今度は別の文を続け、句読点も話すようにします。今回の音声認識は私をはるかによく理解しています。(Speech Recognition)「シーザー」("caesar,")を選択し、それを大文字にするだけで完了です。

音声認識

さて、その行を終了して別の行に移動したいと思います。これを行うには2つの方法があります。「改行」("New line,")と言うと、画面の下の次のスペースにカーソルが下がります。

音声認識

「新しい段落」("New paragraph")と言うと、カーソルが2行下がるので、段落の間にスペースができます。

音声認識

文章や段落を話す練習(Practice speaking)をして、それがどのように機能するかを確認してください。おそらく会話よりもゆっくり話す必要があり、進むにつれて修正する必要がありますが、音声認識(Speech Recognition)はすぐに学習し、数分間練習した後、認識精度(recognition accuracy)は次のようになります。著しく改善されました。

このドキュメントを保存したいとします。(ショートカットキーではなく)メニューを使用している場合、どうすればよいですか?[ファイル(File)]をクリックして[名前を付けて保存(Save As)]をクリックします。そしてそれが私が今していることです。「ファイル」("File")「名前を付けて保存("Save As")」と言い、ファイル名を「名前を付けて保存」(Save As)メニューに話します。

音声認識

しかし、メモ帳(Notepad)のドキュメントにあるものが気に入らず、すべてをクリアしたい場合はどうなりますか?「すべて選択」("Select all")はすべてのテキストを強調表示し、「削除」("Delete")はそれを取り除きます。

音声認識

練習が終わったら、 「メモ帳を閉じる」("Close Notepad.")と言います。書いたものを保存するかどうかを尋ねられ、好きなように「保存」("Save")または「保存しない("Don't save")」と言うことができます。

InternetExplorerでの音声認識(Speech Recognition)の使用

前述したように、音声認識は他の(Speech Recognition)Microsoftソフトウェア(Microsoft software)で最適に機能します。Microsoftの組み込みチュートリアルでは、メモ帳(Notepad)ワードパッドを紹介し、 (WordPad)InternetExplorerについて簡単に説明しました。InternetExplorerでの音声認識(Speech Recognition)の使用についてもう少し調べてみましょう。(Let)

「スタート」("Start")と言ってスタートメニューを開きます。Internet Explorerが表示されていなくても、 「InternetExplorer」と発声すると開きます。次に、「アドレス」と言います。("Address.")これにより、画面上部のURLバーに移動します。(URL bar)青いバーに数字が表示される場合があります。

音声認識

その番号を話し、「OK」と言います。("OK.")ご覧のとおり、ガジェットはここで何をすることを期待しているかを思い出させます。

音声認識

「wwwドットセブンチュートリアルドットコム」と("w w w dot seven tutorials dot com.")言います。ええとああ。音声認識(Speech Recognition)では正しく表示されません。

音声認識

「それを削除して」と("delete that.")言います。次に、「スペル」("Spell it")と言って、個々のキャラクターを話します。「ドット("dot.")」の代わりに「ピリオド」("period")と言う必要があります。数字の7を取得するには、 「7番」("Number seven")と言ってから、残りのWebアドレス(web address)を綴る必要があります。

音声認識

次に、「OK」と言います。("OK.")アドレスはURLバー(URL bar)に転送されます。(辞書に単語を追加するように求められる場合があります。これはあなた次第です。)アドレスがURLバーに表示されたら、 (URL bar)「Enterキーを押してください」("Press enter.")と言います。そして、あなたは行き​​ます。

音声認識

注:(NOTE:)URLバー(URL bar)にWebアドレスを話しているときは、 「ピリオド」の代わりに「ドット」("dot")と言うことができます("period.")そして、あなたは一度に住所を話す必要があります。一時停止しないでください。一時停止すると、音声認識(Speech Recognition)は新しい文を開始したいと考えます。

7つのチュートリアル(7 Tutorials)に関する記事を読みたい場合はどうなりますか?どのように選択しますか?「番号を表示」と("show numbers.")言います。ページ上の各要素は、青いボックス内の数字でオーバーレイされます。読みたい記事の番号を話します(ここでは34番(number 34)です)。次に、「OK」と言います。("OK.")

音声認識

「OK」と言うと記事が開きます。(この素晴らしいオファーも完全に活用する必要があります。)

音声認識

そしてもっとあります

ご覧のとおり、音声認識(Speech Recognition)は最初から驚くほど使いやすいです。それに慣れるのはただの練習の問題です。スタートメニュー(Start Menu)からお気に入りのプログラムを選択して、それらを使って何ができるかを確認してください。それらのすべてが機能するわけではありません。(たとえば、 Adobe(Adobe)のプログラムは実際には互換性がないようです。)互換性のあるものとそうでないものを見つける唯一の方法は、試すことです。この組み込みの音声認識(Speech Recognition)と互換性のない、常に使用しているプログラムがあり、コンピューターとの会話を好む場合は、他社のより洗練されたオプションを検討することをお勧めします。Dragon NaturallySpeakingPremium11.5など。

次の記事では、音声認識(Speech Recognition)のトラブルシューティングと最も一般的な問題のいくつかの解決について説明します。その間、練習と実験を続けてください。それがどれほどうまく機能しているかにあなたはうれしい驚きを感じるでしょう。



About the author

私は 10 年以上の経験を持つソフトウェア開発者です。私は Mac プログラミングを専門としており、TextEdit、GarageBand、iMovie、Inkscape など、さまざまな Mac アプリケーション用に数千行のコードを書いてきました。また、Linux および Windows 開発の経験もあります。開発者としての私のスキルにより、macOS から Linux まで、さまざまなソフトウェア開発プラットフォーム向けの高品質で包括的なチュートリアルを作成することができます。このチュートリアルは、使用しているツールについて詳しく知りたい人にとって最適な選択肢です。



Related posts