Googleは5月20日、AIアシスタント「Gemini」アプリの大幅な機能強化を発表した。新たなUIデザイン言語である「Neural Expressive」の導入にとどまらず、朝の情報整理をサポートする「Daily Brief」、24時間365日バックグラウンドでユーザーに代わりタスクを遂行するパーソナルAIエージェント「Gemini Spark」、さらにmacOS向けアプリの機能強化などを順次展開していく。
現在「Gemini」は、230以上の国や地域、70以上の言語に対応しており、月間ユーザー数は9億人を超えている。これまでの「ユーザーの質問に回答するAI」という位置づけから、今回のアップデートによって、利用者に代わって自律的かつ継続的に作業を進める「エージェント型AIアシスタント」への進化が明確に打ち出された。
新UI「Neural Expressive」により、Geminiの利用体験を全面的に刷新
Googleは、Geminiにおける体験を根底から再設計するため、新しいデザイン言語「Neural Expressive」を導入した。滑らかなアニメーション効果や鮮やかな色彩設計、刷新されたフォント、ハプティックフィードバック(触覚フィードバック)を取り入れることで、より直感的な操作感を実現している。
さらに、自然な対話を可能にする「Gemini Live」の機能をアプリ内へダイレクトに統合。これにより、テキスト入力から音声通話、あるいは音声からテキストへと、状況に応じてシームレスに切り替えられるようになった。
マイク機能の改良も行われており、発話の途中で音声が途切れにくくなったほか、将来的には地域ごとの方言への対応も計画されている。
また、最新のAIモデルを活用することで回答の表現力も大幅に向上した。従来の長文テキストによる回答だけでなく、画像やタイムライン、ナレーション付きの動画、動的なグラフィックなど、内容に応じて最適化された形式の回答をリアルタイムに生成して提示する。
この「Neural Expressive」は5月19日より、Web版、Android版、iOS版を通じて、日本を含む世界中のユーザーに向けて順次提供が開始されている。
高度な動画生成を可能にする「Gemini Omni」
新モデル「Gemini Omni」は、テキスト、画像、動画を組み合わせることで高品質な動画を生成できる機能だ。シンプルな指示を出すだけで、ズーム処理や背景変更といった編集作業が行えるほか、手元の写真や動画のアップロード、テンプレートの適用、さらにはカスタムAIアバターの作成にも対応する。本機能は「Google AI」のサブスクリプションプラン契約者向けに順次提供される。
朝のスタートダッシュを支える情報集約機能「Daily Brief」
新しく追加される「Daily Brief」は、1日の始まりに必要な情報をひと目で把握できるパーソナライズ機能である。
Google Labsでの実験プロジェクトをベースに開発されており、連携している各種アプリから情報を収集する。具体的には、Gmailの受信トレイにある緊急性の高い案件や、Googleカレンダーのスケジュール、確認が必要なフォローアップ情報などを自動で集約し、簡潔な要約レポートとして作成する。
単に情報をまとめるだけでなく、ユーザーが設定した目標に合わせて内容を整理し、優先順位をつけた上で次に取るべき具体的なアクションまで提案してくれる点が大きな特徴だ。
利用者が提示された提案に対してフィードバックを繰り返すことで、使えば使うほど個人の好みに応じて精度が向上していく仕組みが採用されている。
「Daily Brief」は5月19日から、米国の「Google AI」サブスクリプションユーザーを対象に順次提供が始まっている。
24時間体制で自律的にバックグラウンド作業を行う「Gemini Spark」
今回の機能強化において中核となる存在が、パーソナルAIエージェント「Gemini Spark」である。Googleは本機能について、単なるアシスタントから「ユーザーの代理として実務をこなす存在」へと昇華させるための重要なマイルストーンであると説明している。
「Gemini Spark」は「Gemini 3.5」および「Google Antigravity」をベースに稼働し、Gmail、Googleドキュメント、Googleスライドといった「Google Workspace」の各種ツールと密接に連携する。クラウド上で動作するエージェントであるため、ユーザーがパソコンを閉じている時間や、スマートフォンの画面をロックしている間であっても、バックグラウンドで継続してタスクを処理できる点が最大の強みだ。
想定されるユースケースとして、毎月のクレジットカード利用明細を自動的に解析して新しいサブスクリプション契約を検知・通知するタスクや、学校からの連絡メールから提出期限を抽出して家族向けのダイジェストを作成・送信するタスク、散在する会議メモを統合してGoogleドキュメントにまとめ、共有用メールの下書きまでを自動で構成するワークフローなどが挙げられている。
今後は外部アプリとの連携も大幅に拡大していく方針だ。AIモデルと外部のデータソースを安全に接続するための共通オープン規格「MCP(Model Context Protocol)」を介して、Canva、OpenTable、Instacartとの連携を順次開始する。将来的には、これらの外部サービスを活用してユーザーの代わりに予約や注文などのタスクを完了させられるようにする計画である。
さらに、チャットメッセージやメールを「Gemini Spark」宛てに直接送信してタスクを依頼する機能や、独自のカスタムサブエージェントを作成する機能、ローカルブラウザの操作自動化機能なども段階的に追加される予定だ。
セキュリティやプライバシー面への配慮として、Googleは「Gemini Spark」が常にユーザーのコントロール下で動作することを強調している。どの機能を有効にするか、どのアプリケーションとデータを共有するかはすべて利用者が選択可能だ。また、決済処理やメールの実際の送信など、重要なアクションを実行する前には、必ずユーザーへ事前の承認を求める設計が徹底されている。
「Gemini Spark」はすでに一部のTrusted Tester向けに初期提供が開始されており、その後、米国の「Google AI Ultra」サブスクリプションユーザー向けにベータ版が公開される予定となっている。
macOS向けアプリも進化、デスクトップ作業の効率化を推進
デスクトップ環境における利便性を高めるため、macOS向けの「Gemini」アプリも機能が強化される。デスクトップ版アプリに「Gemini Spark」の組み込みが行われ、ローカルファイルの整理やデスクトップ上での定型業務の自動化を支援する。
また、新しい音声理解技術の導入も予定されている。これにより、話し言葉に含まれる言いよどみや言い直し、不自然な間などを適切に解釈し、文脈に沿った自然な会話から正確なテキストデータを整形して下書きを作成する機能が提供される見込みだ。
macOS向けの「Gemini」アプリは5月19日より全ユーザー向けにダウンロード提供が開始されている。「Gemini Spark」機能については米国の「Google AI Ultra」登録者向けに順次展開され、高度な音声体験については今夏のリリースを予定している。
著者情報
EC運営者向けの解説記事とニュース記事を中心としたメディアサイト「ネットショップ担当者フォーラム」を運営しています。
競合企業の動向チェック、消費者動向などがわかるニュース記事や、EC担当者の業務に役立つ実践的なノウハウ記事をはじめ、海外の最新事例や動向が学べる海外ECに関するコンテンツ、通販・ECの専門家によるコラムなどを掲載しています。
- 最新情報をGetできる無料メールマガジン「ネットショップ担当者フォーラム通信」はこちら


