だいぶ前から展開開始されていたんですけどね。なかなか広域に展開されずに僕の環境にも全然展開されて来なく…。ようやく昨日展開されたので記事にします。
以前から Microsoft アカウントで無償で利用できる Copilot Chat (勝手に界隈では通称「個人コパ」と呼ばれている)には、 Copilot と音声で会話する「ボイスチャット」がありました。しかし Microsoft 365 Copilot にはディクテーション(音声入力機能)はあったけどあくまでも喋った事を文字に起こしてくれるだけで会話はできませんでした。それがようやく M365 Copilot Chat にも登場したというわけです。
2025/05/30 付けで Microsoft 365 管理センターのメッセージセンターに以下のメッセージが公開されました。
▼(更新)リアルタイム音声が M365 Copilot チャットと M365 Copilot で利用可能になりました
一般提供開始が8月上旬が延期になって9月上旬になりましたが、9月に入っても全然展開されず、10月に入っても全然展開されず。SNSで観測しても展開されているユーザーはごく一部な感じでした。そして僕の場合はモバイルアプリの方が先に使えるようになり、そしてようやく数日前にPCの方でも使えるようになりました。そのタイミングで複数ユーザーで確認したところかなり広域に展開されているのではと推測します。また、このメッセージではボイスチャット機能には Microsoft 365 Copilot ライセンスが必要かどうかの記載がなく不明ですが、自分の環境で確認したところ Microsoft 365 ライセンスのみのユーザーは全く展開されていないので、もしかしたら本機能は別途 M365 Copilot ライセンスが必要かもしれません。違っていたらゴメンナサイ。
では個人コパの方も含めてちょっと確認してみます。
▼無償版 Copilot Chat
▼メッセージ入力欄を拡大
このようにこっちでは右下のマイクのアイコンが「 Copilot と会話する」というボイスチャット機能のボタンです。クリックすると、
▼会話中
文字と画像だけのブログだとなかなか伝わらないけど、外国人のカタコト日本語みたいな喋り方だけど普通に会話ができます。「~だよ」とかフレンドリーな口調です。そんな人とオンライン通話しているようなイメージですね。オンライン通話だとワンテンポ遅れて会話するじゃないですか。あのイメージです。「え~」とか「あ~」とかフィラーが入っていても問題ないし、割と噛んでもちゃんと前後の文脈から判断してくれたりして、 Amazon Echo に向かって「アレクサ!」で呼びかけて指示をする時は、噛むと「ちょっとわかりません」とか言われちゃうけど、そういう事もないです。会話なのでキャッチボールすると良いですね。一度投げてボールが戻ってきたら終わりじゃなく。そして会話なので最後に「ありがとう」なんて言っても良かったり。
▼会話終了後
会話が終了するとようやく音声での会話がテキストで表示されます。これが会話中にリアルタイムで表示してくれると良いんですけどね。僕が使ってみた限りだと今は個人コパの方は会話中はテキストは表示されないですね。
そして一番上の僕が話したターンではちょっと日本語がおかしいです。僕の活舌が悪かったのか。しかし回答は意図した回答になっているんですよね。「 Thank you.ありがとう」って部分も僕はただ「ありがとう」としか言ってないんですけどね。でもちゃんと会話になっているなら問題ないです。
▼ Microsoft 365 Copilot Chat
▼メッセージ入力欄を拡大
さて、ここでUXの一貫性という点では指摘事項がありますよね。個人コパだとマイクのアイコンがボイスチャットのボタンだったのに、 M365 Copilot Chat ではマイクのアイコンはディクテーションで、その右の縦5本線のアイコンがボイスチャットのボタンなんです。これは両方利用する人にとってはややこしい。
では実際にこちらも試してみます。
▼会話ができます
個人コパ使った後にこっちも使ったので違いが色々見えてきたけど、まず個人コパはボイスチャットを開始するとあっちから話しかけてきたけど、こっちのボイスチャットはこちらから話しかける感じでした。またこっちはこのように会話中に音声だけじゃなくテキストも表示してくれます。それはこっちの方がありがたいです。タイミング的にはこっちの音声はリアルタイムには拾ってくれるわけじゃなく、話し終えるとワンテンポ遅れて質問と回答がテキストに表示され、回答のテキストを音声が読み上げるような流れです。それでも個人コパの場合は音声だけなので外から雑音があったりすると聞き取れなくて困りますが、こっちの方は先にテキストが出てくるので目と耳でしっかり補完し合えます。
▼会話終了後
今回は見られたらモザイクかけたくないので当たり障りのない会話をしましたが、「職場」にした状態なら当然社内の情報についてもしっかり対象としてくれるので、音声会話でもっと社内の突っ込んだ会話ができますね。
ちなみにモバイルアプリの方でボイスチャットをやってみると、
▼ Microsoft 365 Copilot モバイルアプリのメッセージ入力部分
このようにボイスチャットのボタンがあり、タップすると、
▼会話中
スマートフォンなので本当に電話しているような感じで会話ができますが、このようにPCとは違ってテキスト表示はされません。
▼会話終了後
会話が終了するとテキストチャットと同じく会話履歴としてテキストが表示されます。
という事でボイスチャットの紹介でした。半年?1年?前から Copilot もマルチモーダルを意識して特に音声のアップデートが多いと感じます。やはり生成AIを利用するUI/UXとしてテキストチャットの次の段階として音声での会話にシフトしていく感じですよね。実際に試していただくとわかると思いますが、予想以上に使えます。特にタイピングが苦手な人にとってはうれしいですね。少し前に Windows 11 で Copilot が使えるようにします!というアナウンスが Microsoft からあって、その中で「Hey! Copilot! 」で話しかけられるようになるという話もありました。
Making every Windows 11 PC an AI PC | Windows Blogs
https://blogs.windows.com/windowsexperience/2025/10/16/making-every-windows-11-pc-an-ai-pc/
業務利用となるとまた色々とハードルが高そうですけどね。僕みたいに在宅勤務で自宅に静かな仕事部屋がある人は良いですけど、狭い日本ではオフィスも隣の人との距離も近いですよね。そんな状態で大勢がPCに向かって「Hey! Copilot! 」で話しかけてもね。たぶんウルサイだの迷惑だの色々と厳しいんじゃないかと思います。とはいえ、10年前20年前に見たSF映画の自宅に帰るとAIに話しかけて何でも操作してくれる時代がそこまで来ていますよね。いや、すでにスマートデバイスで実現できていますよね。そして Copilot のボイスチャットでは、普通に会話ができちゃうんです。ワクワクする反面、1年後や半年後も読めなくなって不安もありますね。