Windows をもっとインテリジェントに。進化を支える NPU の力
※本ブログは、米国時間 10 月 2 日に公開された “How the NPU is paving the way toward a more intelligent Windows” の抄訳を基に掲載しています。
Copilot+ PC の内部には、小型ながらも強力な AI エンジンが備わっています。これは、最新シリーズの PC 向けにマイクロソフトが半導体パートナーと協力して開発したニューラル プロセッシング ユニット (NPU) であり、従来スマートフォンで使用されていたものが、現在 Windows PC にも搭載されています。
NPU チップは、ローカルでの AI タスクの実行を高速化します。つまり、デバイス上で処理が行われることで Copilot+ PC のデジタル エクスペリエンスが向上します。Copilot+ PC が他のデバイスと異なるのは、NPU が毎秒 40 兆回以上の演算 (TOPS) の実行を求められるという点です (TOPS はシステムが 1 秒間に実行できる演算の回数を兆単位で示す値です)。
NPU は機械学習や小規模言語モデルの処理を効率的に行うことに特化しており、画像生成やスマート カメラのエフェクトなどの機能を支えています。また、PC の他の領域で消費される電力を抑え、電源に接続していない時のバッテリー駆動時間を延長します。
Windows の AI テクノロジの大部分を開発した応用サイエンス チーム設立メンバーであり、コーポレート バイス プレジデント兼テクニカル フェローを務める Steven Bathiche は次のように述べています。「Windows に搭載されている AI 機能は新たなエクスペリエンスを生み出します。マイクロソフトが開発したのは、このエクスペリエンスをサポートするためのハードウェアです」
NPU は、膨大な量のデータを並行して処理し、毎秒何兆回もの演算を実行することができるアーキテクチャで構築されています。汎用プロセッサ (CPU) だけでなくグラフィックス プロセッサ (GPU) と比較しても、NPU は機械学習演算に優れ、はるかに少ない電力で動作します。NPU が AI ワークロードをきわめて効率的に処理することで、CPU はマルチタスク、GPU はグラフィックスやアニメーション、ゲームというように、それぞれの得意分野に専念できるようになります。
NPU によって、マイクロソフトを含むメーカー各社は、比較的低価格なデバイスで高度な AI エクスペリエンスを実現することができています。従来であれば数千ドルのマシンが必要だった演算を数百ドルのデバイスで実行できるようになったことで、テクノロジをさらに幅広いユーザーに届けることができるようになりました。
また、こうした NPU のアーキテクチャのおかげで、Copilot+ PC は今後さらに先進的なテクノロジが登場した際にも、すぐにそれを活用できる状態になっています。
たとえば、Copilot+ PC に搭載された NPU は、PC 上でより高速に検索や処理を実行できます。改善されたセマンティック機能対応の Windows Search では、自然言語で検索を行い、ファイル、設定、写真からより正確な結果を得ることができるようになりました。また、ビジュアル インテリジェンスにより、画像からテキストをコピーしたり、画面上のテキストの内容をまとめたりといったさまざまな操作を簡単に行えます。
NPU ではある程度のローカル処理が可能であり、クラウドでの処理と併用することで、さらに大規模なモデルを実行できる可能性があります。インターネットに接続しているときは、NPU をクラウドと組み合わせて使用すると、さらに拡張的なエクスペリエンスを実現できます。
これは、今年創立 50 周年を迎えたマイクロソフトと 11 月に 40 周年を迎える Windows にとって、大きなマイルストーンとなります。
Copilot+ PC による NPU の進化
Copilot+ PC 用 NPU の開発の道のりは、数年前に Surface Hub 2 スマート カメラから始まりました。専用プロセッサによって、映像のフレーム調整や遠近感の補正といった高度な AI タスクをローカルで実行することができ、強力なオンデバイス AI 処理がユーザー エクスペリエンスをリアルタイムで向上させるということを示す、説得力のある概念実証となりました。これには、アイ コンタクト、背景のぼかしの強化、周囲の雑音を取り除く AI 音声ノイズ除去などが含まれます。マイクロソフトはこのスマート カメラから得た学びを活かし、シリコン パートナーと協力して一般的なコンピューティング環境に応用しました。AMD、Intel、Qualcomm の各社が製造した NPU を搭載する Copilot+ PC は、その進化を直接受け継いでいます。
このような進化が、現在の Copilot+ PC に搭載されている AI 機能の基盤となっています。
リコールはユーザーが任意で有効化できる探索可能なタイムライン機能で、過去に Copilot+ PC でアプリを通じて表示したものを視覚的にさかのぼって呼び出すことができます。この機能で写真、リンク、メッセージなどを探し出し、そこから操作を続行することが可能です。クリックして実行は、PDF や画面上の任意のテキストへのショートカットを作成し、その画像を使用してテキストの要約、リライト、コピー、または検索を行う機能です。この機能に新たな操作が追加され、選択したテキストから箇条書きを作成するオプションなどを利用できるようになりました。
さらに、Copilot+ PC では NPU によってプロ レベルの AI 編集ツールも使用できるようになっています。このツールの使用にサブスクリプションは不要です。Microsoft フォト アプリには、写真のライティングを動的に制御できるリライトという新機能が追加されました。写真の明るさが不十分な場合に修正したり、クリエイティブなエフェクトを適用したりすることができ、複雑なライティング調整作業が簡素化され、視覚的で直観的なエクスペリエンスに変わります。
そして、NPU の最大のメリットの 1 つは、さまざまな AI 駆動型アプリケーションをいくつも同時に実行できるという点です。大規模言語モデルを基盤とする生成 AI はクラウドで実行する必要がありますが、小規模言語モデルは NPU で実行できます。
Bathiche は、「Windows プラットフォームはマシン構成に応じてワークロードを移行する柔軟性と適応性を備えている」と述べています。たとえば、GPU が高性能であるほど、PC はグラフィック負荷の高いワークロードをより多く GPU に任せることができます。しかし、消費電力を抑えて効率を上げたい場合は、NPU を CPU や GPU と連携させてバックグラウンドで AI プロセスを実行することが可能です。
将来の展望: より多くの人に向けて、さらに使いやすく
「考えてみると、コンピューターの使い方は 60 年前からほとんど代わっていません」と Bathiche は語ります。これはマウスとキーボードのことを指しています。一方で、AI エージェントは「ユーザーの要求を理解し、承認を受けてユーザーの代わりにタスクを実行するインテリジェントなソフトウェア アシスタント」であり、将来的にはユーザーによる操作の手間を大幅に減らしてくれるとも述べています。
Bathiche によると、NPU は AI エージェントの処理速度と応答性を大きく向上させ、直観的な操作をさらに進化させることになるでしょう。また、NPU を使用すると、エージェントはクラウド環境を必要とするような高度な AI モデルをローカルで実行できるようになります。
Copilot+ PC では、新たに設定エージェント (英語) が追加されました。このエージェントに「マウスが小さすぎる」のように伝えると、カーソル サイズの変更など、ユーザーが見つけるのに苦労する設定項目を何百もの選択肢の中から提案してくれます。チームは、近いうちにオンデバイス エージェントがさらに複雑なタスクを担うようになることを構想しています。
Bathiche は言います。「エージェントはまさに北極星のようです。今やユーザーにとってはインタラクションのための、開発者にとってはプログラミングのための新たなユニットとなっているのです」。
見出し写真: Steven Bathiche、コーポレート バイス プレジデント兼テクニカル フェロー/Windows の AI テクノロジの大部分を開発した応用サイエンス チーム設立メンバー (撮影: Dan DeLong)




Join the conversation