Monthly Archives: July 2012

Mac OS X Mountain Lion新機能・音声入力についてのメモ

1. デフォルト設定では音声入力がオフになっているので、まず機能をオンにする。

  • りんごマーク→システム環境設定→音声入力と読み上げを開き、音声入力を入にする。
  • 音声入力を開始するためのショートカットを設定する。デフォルトはファンクションキーの二回押し。
  • 言語のリストから日本語を選んで選択。英語に変えれば英語の音声入力も可能。英語はイギリス英語、アメリカ英語、オーストラリア英語から選べる。
  • 入力マイクが複数ある場合は、「音声入力と読み上げ」の左側に表示されているマイク画像の下の三角形をクリックするとリストが表示されるので、使いたいものを選ぶ。

2.  使い方

  • 音声入力を開始するには、指定したショートカットを使う。ショートカットを起こすと、マイクの画像と完了ボタンが表示される。
  • 音声入力中には入力した文章は表示されない。入力が終わった時点で、表示される仕様になっている。
  • 入力を止めて文章を表示させるには、完了ボタンをクリックするか、リターンキーを押す。しばらく話さずに黙っていても自動的に終了するが、タイムアウトまで時間がかかる。
  • 一度に変換できるデータ量に限界があるらしく、長い文章を一度に音声入力しようとすると、途中で勝手に入力を中断して変換に移行してしまう。適宜区切って変換させる必要がある。
  • 入力機能が変換に迷った箇所については、その部分の下に点線が引かれている。その部分の変換が間違っている場合は、マウスで選択して右クリックを押すと、別の選択肢が表示され、選べるようになっている。ただし、右クリックをしても選択肢が表示されない場合もある。原因は不明。
  • 点線表示がない場合は、誤変換修正を学習させることはできないらしい。普通に上書き修正するしかない。
  • 句読点は、「点」「丸」「中黒」「三点リーダー」「ダッシュ」といえば「、」「。」「・」「…」「‐」が表示される。
  •  かっこ類は、「かっこ」または「かっこ開く」で 「(」、「かっこ閉じる」で「)」が表示される。同様に、「かぎかっこ」で「「 」、「中かっこ」で「{」、「大かっこ」で「[」が入力できる。
  • 改行するには「改行」、1行開けるには「新しい段落」と言う。
  • 入力箇所の削除や、カーソルの移動、メニュー選択などの音声コマンドはないらしい。

ちなみに上記もほとんどは音声入力を使って書きました。認識率は、やっぱり80%くらいですかね。きちんと字数を数えてみないとわからないですが、それほどあちこち修正しているという感じはしません。入力用のマイクには、私の使用環境では内蔵マイクやディスプレイオーディオの選択肢もありますが、音声入力専用のUSBヘッドセットマイクを使っています(以前からVXi社のマイクを愛用しているので、今回もVXi X100)。ドラゴンスピーチを使っていた時の経験だと認識率はマイクによって大きく左右されたので、内蔵マイクやディスプレーのマイクを使った場合のテストも、そのうちやってみたいと思います。

Advertisements

Mac OS X Mountain Lionに日本語音声入力登場

また間が空いてしまいました。相変わらずプレゼンシリーズの更新が放置状態になっていますが、まずは別の話題を。

待ちかねていたMac OS Mountain Lionが発表されたので、早速更新しました。なぜ待ちかねていたのかというと、新機能の一つとして、音声入力が盛り込まれていると聞いていたからです。しかも、日本語・英語の両方で入力が可能だとのこと。

早速試しにテスト入力してみました。テスト用の文章はIJET-23日英・英日翻訳国際会議のプログラムから適当に選んだものです。

日本語原文:

実用文を読む時、私たちは必ずしも一語一文、目で追いながらじっくり読むわけではありません。たとえばある文が接続詞の「しかし」で始まるとすると、前に書いてあったことから内容を予測して、あとの部分を読み飛ばしたりします。また、文章には「リズム」というか「ながれ」があり、それに乗ってスイスイと読んで、情報を得ていきます。

今回のワークショップで、 「英語の実用文をさっと一度読んで意味が伝わる和文に仕立て上げるには? 」という大きなテーマについて、 「ながれ」という切り口から皆様とともに考えたいと思います。まず、英文と和文の構造や構成の違いについておさらいした後、文と文の「つながり」に関係する接続詞、句読点(日本語ではあまり使われないコロンやダッシュなど) 、これまであまり取り上げられることがなかった(らしい)文末表現などの観点から検討する予定です。

音声入力結果、無修正:

実用本を読む時、私たちは必ずしも151分、目で追いながらじっくり読むわけではありません。例えばある分が接続詞の(しかし)で始まるとすると、米に書いてあったことから内容を予測して、後の部分を読み飛ばしたりします。また、文章には「リズム」と言うか「流れ」があり、それに乗ってすいすいと読んで、情報を行きます。

今回のワークショップでは、 「英語の実用文はさっと一度読んで意味が伝われば分に仕立て上げるには? 」という大きなテーマについて、 「流れ」という切り口から皆様と共に考えたいと思います。まず、英文と和文の構造や構成の違いについておさらいした後、文と文の「つながり」に関係する接続詞、句読点(日本語ではあまり使われない:八‐など」 、これまであまり取り上げられることがなかった(らしい)文末表現などの観点から検討する予定です。

英語原文:

Are you interested in interpreting but afraid to try because you’re prone to stage fright? Whether you’re starting out or are a veteran pro, there’s always room to make the job more fun.

The first part of this session will take a fresh look at what it means to help people communicate. I will ask you to join me in discussing differences and similarities between translating and interpreting as we explore specific areas, expectations, and how interpreters can benefit from also being translators. There is no need to shy away simply because someone says it’s unusual to be successful in both. You don’t have to be, but you can be.

音声入力結果、無修正:

Are you interested in interpreting that afraid to try because you have drawn to the stage freight? I know you’re starting out or I’ll get temporal, there’s always room to make that of more fun.

The first part of this system will take Krishna Kant hardly means to help people communicate. I will ask you to join me in discussing differences and similarities between translating and interpreting as we explore specific areas, expectations, and how interpreters can benefit from also being translators. There is no need Tiselius simply because someone says it’s unusual to be successful in both. You don’t have to be, but you can be.

第一印象としては、まずまず悪くない印象を得ました。音声入力エンジンはiPhoneのSiriと同じものらしいのですが、音声入力ソフト「ドラゴンスピーチ(Dragon Naturally Speaking)」を作っているニュアンス社が開発に関わっているようで、なるほどという感じです。マウスを動かしたり入力を削除したりするコマンドはあるのか?とか、誤入力を修正、学習する機能があるのか?とか、いろいろまだ疑問はありますが、ぼちぼち使いながら答えを探していくつもりです。ちなみにこの文章も、音声入力に手で修正を加えたものです。おおざっぱな印象では、認識率は80%ぐらいでしょうか。