どうも、明日が誕生日のどうも僕です。もう49歳になります。50歳まであと一歩。ゴリゴリのオッサンです。このブログは何歳まで続けるんでしょうね。
ついに来ました!待望だった人も多いハズです。音声認識と顔認識。
これがどういう機能かというと、音声プロファイルを設定すれば、 Teams Rooms などインテリジェントスピーカーを利用すると、会議室に複数人で会議をしてもトランスクリプトで自分を識別してくれます。顔プロファイルを設定すれば、同じく Teams Rooms では顔を自動的に認識して名前を表示したり参加者リストに名前が追加されたりします。
これだけ聞くと「ウチ Teams Rooms ないから関係ないじゃん!」って思いそうですが、実は音声認識に関しては確実にうれしい事があるんです。
音声プロファイルを設定すると音声分離機能も使えるようになり、これは自分の音声が識別されるので、ノイズ以外にも自分以外の音声も抑制してくれるんです。つまり、今まで多くの困りごととして、オフィスのオープンスペースで会議に参加している人が話をしていると、周囲の人の声まで拾ってしまい聞く方が集中して聞き取れない問題が解消されるんです。特に顧客やパートナーなど社外の人とオンライン会議をしている時に、オフィスの周囲の人の声が相手に聞こえてしまってはマズイ場合もありますよね。そういう声も全て抑制されるんです。これはもう使わないわけないですよね。
それが、今まで設定したくてもできなかった機能でした。
▼「設定」の「認識」を開いても設定できませんでした
これは去年2024年に管理者が PowerShell で有効化しないと設定・利用できない機能だったんです。なので対応している会社であれば去年から利用できていたと思います。しかしロードマップ上ではそのうち既定で有効になるアナウンスがあり楽しみにしていたのですが、延期を繰り返し…そしてようやく展開され始めています。
▼ Microsoft 365 管理センターのメッセージセンターを探すと2件
新しい方は 2024/10/17 付けで公開されていました。古い方は9月公開なのでアナウンスされてから既定で有効化されるまで半年ほど時間がかかりましたね。
▼(更新済み)Microsoft Teams: 音声と顔の登録に関する新しいポリシーは既定で “オン” になります (今すぐ構成)
こちらのメッセージでは主にテナント管理者向けの情報が記載されているので、ユーザーにはあまり関係ないでしょう。
冒頭に書いたこの機能のメリットの1つは話者の特定です。これは Microsoft 365 Copilot ライセンスのあるユーザーが利用できる Copilot in Teams の会議のまとめ機能の場合、話者が特定されていないと特定の人が独り言を言っている状態になってしまうなど正確ではありませんでした。ただし、これはあくまでも Microsoft 365 Copilot もしくは Teams Premium ユーザーが関係する話。多くの人が関心があるのはやはり音声分離機能でしょう。
僕は PowerShell が苦手という事もあり、極力 PowerShell を使わないと利用できない期間は、当ブログの記事にはしません。しかし、昨日、ようやく僕の環境でも音声認識・顔認識の設定ができるようになったので、試してみます。
▼「設定」の「認識」
このように文言が変わり、各項目ごとにプロファイルの作成ボタンが表示されました。
まずは音声プロファイルを作成します。作成ボタンをクリックすると、
▼新しいウィンドウが表示されます
プロファイルを作成するのに指定されたテキストを読み上げます。なのでこれは僕の推測ですが、この時はなるべく自分が普段よく使っているマイクを使った方が良いのかな?と思います。ただ、複数PCを使ったり Teams Rooms を使うとなると…品質の良いマイクを使った方が良いのかな?なんて思いました。なんとなくノートPCのマイクだとプロファイルの精度が悪そうな気がして。なんとなくですよ。あと…風邪などで声が枯れている時はどうなんでしょうね?なるべくコンディションが良い時にやった方が良い気がしますが。
▼なので僕は良いマイクに切り替えました
「音声キャプチャを開始」をクリックします。
▼キャプチャ開始
ちょっと嚙んじゃいましたよ。読み上げるテキストの中で「私に間違があった場合は、」って送り仮名がおかしいし!なんて思いながら終了させたら、
▼失敗らしい…
あっ、切り替えたハズのマイクが元に戻っていてウェブカメラのマイクに切り替わっていました。このマイクは性能が悪いのでうまく拾えていなかったんでしょうね。やはりマイクは品質が良いものを使った方が良さそうです。
再びトライしました。
▼今度は読み上げた後にキャプチャを終了させると少し音声の学習に時間がかかり…
▼音声認識の設定は完了しました
音声認識だけで顔認識が不要の場合はこれで終わりにしても大丈夫みたいです。なので今のところ Teams Rooms みたいなインテリジェントカメラが設備されている会議室がない環境の場合は、顔プロファイルは作成しなくても良さそうですね。
とりあえず僕もそういう設備は持っていませんが、登録だけはしようと思います。
▼音声認識設定完了の流れから顔認識の「開始する」をクリックすると、
▼別で新しくウィンドウが開きます
こちらもカメラの性能もある程度良いものにした方が良いのかな?それよりもおそらく照明などをしっかり調整して、顔が暗くなり過ぎないような環境を整えるのも大事そうですが、わかりません。
▼横のサンプルに合わせて円の中央に顔が映るように…
恥ずかしいから変な顔をしていますが、皆さんは実際に開始する時は変顔しないようにしましょう。僕もこの後開始した時は普通の顔で開始しました。
▼これちょっと大変…
なんか失敗していますけどね。合計9回写真を撮ります。色々な角度を指定されて。
▼終了
これで設定終了です。
では実際に試してみます。とはいえ、僕は Teams Rooms の環境がないので、おそらく多くの人と同じく、音声分離機能のみを試します。
会議に参加して、
▼会議ウィンドウのバー内、マイクの右の下矢印をクリック
下の方に「ノイズ抑制」で「音声の分離」という選択肢があって、すでに選択されていました。つまり音声プロファイルを登録すると勝手に音声分離機能が使えるようになっているんですかね。でも念のため皆さんも確認してください。
▼会議の自分のカメラ
音声分離機能がオンになっていると、自分のカメラの左下にそれっぽいアイコンが表示されています。
▼マウスカーソルを当てた状態
このように「音声分離オン」と表示されますが、残念ながらこのボタンをクリックしてもオンオフはできません。
▼「…」にも音声分離のオンオフはできません
なので、音声分離のオンオフは上部のバーから行うしかなさそうです。
さて、一通り試してみました。ただその結果は文字やスクショじゃ表現できないので、これは皆さんがそれぞれ実際に試してみてください。試したところ万能というわけじゃありませんがイイカンジで自分以外の声は拾わないです。試しに僕とDNAが近いであろう息子にも話してもらったところ拾いませんでした。そして、例えば自分の声を裏声で話してみたりしたんだけど、拾わなくなりますね。これはそのうち試してみた動画を撮って YouTube のネタにしたいです。
注意点としては、声色を極端に変えると自分の声も自分の声以外と認識されて抑制される事もあるので、もしかしたら風邪などで声が枯れてしまった場合は、音声分離をオフにした方が良いかもしれません。また、PC1台で複数人が話す場合は、音声プロファイルを作成したユーザー以外の声は抑制されるので音声分離はオフにしましょう(あれ?これライセンス的にNGなんだったっけ?)。
そうそう、この手の個人情報(音声や顔)をデータとして保存される仕組みに付き物なのがプライバシーですね。なので設定後にもう一度設定画面を見ると、
▼再度「設定」→「認識」
うまく動作しない場合は「更新」から再度プロファイルを作成すると良さそうだし、「削除」をすれば30秒ほどで削除されるようです。また「プライバシーポリシー」なんてリンクもあり、変な事に使いませんよ宣言のページが表示されます。また、 Microsoft の本機能の説明などのドキュメントには必ず「このデータをモデルトレーニングなど機能利用以外の用途では使用しません。」という注意書きが記載されていますね。
▼注意書き
音声と顔の登録の概要
https://learn.microsoft.com/ja-jp/microsoftteams/rooms/voice-and-face-recognition
何か気になる事があれば、このリンク先のページで確認しましょう。
という事で、オンライン会議で周囲の声を拾うのが問題だったりする事は多いと思うので、結構待望の機能だと思います。是非設定して使ってみましょう。