2025年アップデート Google Geminiの新機能

2025年はGoogle Workspaceにとって大きな進化と莫大な進歩を遂げた年になっています。その中でもGeminiが貢献してる役割は非常に大きく、アップデートの量が半端ではありません。そこで、元のエントリーからGeminiに関しては分離独立してまとめることとしました。

こちらのエントリーでは、Geminiアプリ、Gemini for Google Workspace、NotebookLM、Gemini APIについてそのアプデ情報をまとめていきます。Google Workspaceのアプデについては以下のエントリーを参考にしてください。

2025年アップデート Google Workspaceの新機能

目次

共通事項

概要

2024年はGemini AdvancedおよびGemini for Google Workspaceが大躍進しつつも、大きな仕事への変化を与える?というレベルには至っていません。しかし前述にあるようにGeminiが標準搭載されたことにより今年度からは大きな変化がありそうです。

Gemini for Google Workspaceの実力ってどれだけあるのか?

Gemini Businessの統合と値上げ

2025年1月16日、Google Workspaceについて、アドオン扱いであったGemini for Google WorkspaceのBusinessが標準搭載されることとなり、結果的に2025年3月17日より値上げが実施されるとのこと。ただしこれまでのような高額な金額がそのまま乗っかるのではなく、Business Standardであれば240円/月の負担増でGemini Businessが標準で利用できるようになります。

このような方針転換と価格設定の変更は大きなビジネス戦略があってこそなので、この値上げがどのような吉凶を招くか?

2025年2月20日にDeep ResearchまでもがGoogle Workspaceユーザで使えるようになったとうことで、以下のエントリーとは別にGemini活用のイロハに関するページの作成が必要だなぁと考えています。

Google Workspaceの値上げとGeminiが標準装備化へ

画像生成日本語機能

2025年1月29日、これまで日本語など一部環境では何故か利用できなかったサイドパネルからの画像生成機能が有効化されました。対応した言語は以下の7言語Googleドキュメント、スプシ、ドライブ、Gmailで利用することが可能です。スライドは後述で追加されました。

  • フランス語
  • ドイツ語
  • イタリア語
  • 日本語
  • 韓国語
  • ポルトガル語
  • スペイン語

Business Standard以上およびGemini Education, Google One AI Premiumを利用してるユーザが使える。

図:ドキュメントで生成してみた

図:スライドでは何故か使えない・・・

画像生成で人物の生成が可能に

2025年2月7日、画像生成機能に於いてGeminiアプリ、Gemini Advanced、Gemini for Google Workspaceのサイドパネル(ドキュメント、スプレッドシート、ドライブ、スライド、Vids)に於いてこれまでサポートされていなかった「人物」の生成が出来るようになったようです。

Gemini Advancedでは出来るようになっていることを確認しました。前述の画像生成日本語サポート時点ではできなかったのですが、割と早く対応されましたね。Gemini for Google Workspaceのサイドパネルの場合、何故か日本語では「現時点では、表示される人物画像の結果は限定的です。他にお手伝いできることはありますか?」と出て生成されず、英語で問い合わせをすると、生成されました。

図:人物生成に対応しました

図:サイドパネルは英語なら生成可能

画像の背景を削除する機能

2025年3月11日、Google Vidsおよびスライド、図形描画に於いて挿入した画像の背景部分を削除する機能が提供開始されました。Vidsについては言語が英語でのみ対応とのこと。

まだ自分のテナントに展開されていませんが、写真に写った被写体を切り抜く為に背景画像を削除し透明にする機能はこれまでもiPhoneやAndroidなどでも見てきたかと思います。資料作成でこの背景削除は結構面倒なフォトレタッチ作業なのでありがたい。

公式ドキュメントはこちらになります。Google Workspace Business Standard以上で利用することが可能です。

2025年5月30日、日本語UIでも本機能が使えるようになりました。対象切り抜きや背景透明化の為だけにWebサービスやGIMPなどを使っていた作業から開放されました。

図:日本語でもついに背景削除機能がリリース

図:真ん中の被写体以外を自動で切り抜くようだ

図:美味しい料理もバッチリ切り抜き

Gemini Advancedの会話履歴保持期限設定

Google WorkspaceにおけるGeminiチャットの履歴については、個人のGoogleアカウントと異なりユーザが削除することが出来ません。しかし、2025年5月5日に管理コンソールに於いて、保持期限に関する設定が追加されました。

注意すべきこととして、2025年5月末までになんらアクションを起こさない場合には、管理コンソールにはデフォルトの18ヶ月保存の設定が行われます。

また会話履歴機能のオンオフが出来るようにもなっており、オフにした場合、最大72時間まで会話履歴が保持されるようになります。なお個人のGoogleアカウントのようにユーザが任意に削除することが出来ない点は変わらないようです。

管理コンソールの生成AI→Geminiアプリ→Gemini会話履歴を開くと設定が可能です。

※もとよりGoogle Workspaceの場合は法人向けであるため、ユーザによってホイホイ会話が削除されてしまうのは、内部統制上望ましくないという観点があるため、Vaultでの出力サポートがなされたように原則保持するのが方針のようですね。

 

図:会話履歴保持期限の設定が可能に

Geminiサービスのプランが変わります

名称変更とUltraプラン

2025年5月20日のGoogle I/O 2025より、これまでGemini Advancedという名称であったGeminiのチャットアプリの名称がGemini Advancedであったものが、Gemini AI Proへと変更されました。表面的にはGeminiとだけ表示され、アカウントのアイコンの隣に「Pro」の表記がある状態になっています。Google Workspaceプランに於いてはこのAI Proが標準となります。公式ドキュメントはこちらになります。

また、同時にGemini AI Ultraと呼ばれる超高額なプランが登場。その金額月額249.99ドル(ドル円レートが144円換算では、35,998円)。その内容は以下の通り。高額ですが業務用プロ向けの全部盛りのプランになっています。

  • 使用制限が大幅に緩和されてほぼ使いたい放題(Veo2なども含む)
  • Veo3などの早期アクセスが可能になります。
  • Gemini 2.5 Proより更に強化された推論モデルであるDeep Thinkが利用できます。
  • AI動画制作ツールであるFlowにアクセスが可能になります(1080p, 高度なカメラコントロールが可能に)
  • Google WhiskにてVeo2生成動画をショート動画に変換することが可能に。
  • NotebookLMにて同様に大幅に制限が緩和予定です。
  • Youtube Premiumが標準添付となります。
  • 30TBのGoogle Driveストレージが標準装備となります。
  • Project Marinerを使ってのAIエージェントで同時にタスク実行が10個まで可能になります。
  • Google各アプリやChromeからGeminiに直接アクセスしての利用が可能になります。

図:画面上も表記が変わっています

Introducing Flow | Google’s New AI Filmmaking Tool

学生向けに15ヶ月無償プラン

今回のGoogle I/O 2025ではさらに大学生向けのGemini 15ヶ月無償プランが供出されています。利用するには原則ac.jpおよびeduドメインのアカウントを持つ、個人のGoogleアカウント所持の大学生。Google One AI Premiumに相当するもので、個人での申込みが必要になります。

申込みはこちらからになります。Gemini AI Proとして利用が可能ですが、Gemini for Google Workspace, NotebookLMやDeep Research等、2TBのストレージが使えるようになります。ただし大学でGoogle Workspace for Educationを使ってのアカウントの場合、申込みは出来てもデータ連携は出来ません。あくまでも独立したアカウントであり、また大学単位で申し込みが出来るものでもありません。(年齢制限は18歳以上)。

無償期間が終了すると自動的に支払い要求されることになるので、あくまでも15ヶ月間の無償期間付きの「契約」となるので要注意です。

このプランは期間限定であり、2025年6月30日までの申込期限、なおかつ2025年8月31日までに学生としての利用再認証が必要です。

※一部の大学生の場合、大学から与えられてるGoogleアカウントのドメインが「jpドメイン」で申し込みで弾かれています。その場合にはこちらの申請フォームから申請をすることで契約を行うことが可能です(早稲田大学や慶応大学だとこのパターン)。

Gemini 2.5 Native Audioリリース

2025年6月3日、Gemini 2.5として人間らしい音声の生成機能としてネイティブオーディオがリリースされました。2つの大きな機能で構成されており、現在はまだGoogl AI Studioでのみ利用することが可能です。音楽生成ではすでにLyriaというものがリリースされていますが、このネイティブオーディオはNotebookLMの音声概要生成などでも使われてるようです。

おもな機能ですが

プロンプトの指示内容に従って喋り方やイントネーション、朗読のように随所随所で指示を入れて読み上げ方を指示といったことも可能なようです。TBSラジオのラジオ朗読みたいなものが、作れそうですね。もちろん生成したデータはダウンロードが可能です。ためしに短い読み上げを作ってみました

図:コンビニのやり取りを作ってみた

Google AI Studioで「Gemini 2.5」の制御可能なテキスト読み上げを試してみた

データリージョン適用が可能に

2025年6月9日、Google Workspace同様にGeminiのデータリージョン指定に関して、EUおよび米国を指定可能になりました。管理コンソール上から組織部門単位で指定することが可能です。

本機能は、Google Workspace Enterprise PlusのプランおよびAssured Controls と Assured Controls Plusのアドオン導入している場合にのみ利用することが可能です。

図:geminiでのリージョン指定

NotebookLM

2025年6月、GeminiがAdvancedからAI Proへと改称したのに伴い、NotebookLMもLM PlusはLM Proへと改称されました。

Notebook LMがコアサービス化

2025年2月5日、昨年の9月に早期アクセスサービスとして提供されていたNotebook LMおよびLM Proが、Google Workspaceのコアサービスとして正式に追加されました。

昨年12月13日には、Gemini for Google Workspace導入企業はLM Plusが利用可能となっていたので、今年のGoogle Workspace統合によってGoogle Workspace利用者はNotebook LM Proが利用可能になっています。Notebook LMとLM Proの違いは以下のとおりです。公式のページはこちら。ノートを共有しても制限値に変わりはありません。

項目 Notebook LM LM Pro
ノートの数 100 500
ノートに使うリソースの数 50 300
1日のチャット数 50 500
1日の音声生成 3 20
プレミアム機能 無し 有り

プレミアム機能とは、チャット専用ノートブックの共有機能や、チャットスタイルのカスタマイズ、ノートブックの利用状況分析の3つの機能です。

個人向けに特化した自分だけのAIチャットボットを、様々な資料を食わせてカスタムしていくものなので、Gemini Advancedみたいな汎用的なものとは少々毛色が異なるサービスなのですが、就業規則やら開発ガイドラインなどを食べさせてチームで共有すれば社内で簡単に専用のボットを用意出来るのが特徴です。

自分の場合だとGoogle Workspaceのアップデート情報をどんどん食わせて、あとから「そう言えば昔なんかこういうアプデがあったような・・・」という知識の再探索用として脳みその補完用で使っています。単一の目的ごとになるべく特化したものにしたほうが使い勝手が良いのではないかと思います。

コアサービスになったことで、昨年のその他のGoogleサービスではない場所に設定場所が異動してるのでオンオフしたい場合には注意が必要です。

※この機能はGoogle Workspace Business Standard以上で利用が可能です。

※また、Notebook LM Proかどうかハッキリわかるように右上にPro表示も行われています。

※試しに厚労省の就業規則モデルのPDFをアップして、育児休業について聞いてみたところ、結果の要約および該当規定へのジャンプが出てきて、目的の情報にたどり着けました。

図:自作の専用AIチャットボット

図:設定場所が変わってる

図:就業規則を読み込ませてみた

図:NotebookLM Proの表示

Notebook LMで自分だけの専用生成AIを作ろう

コンテキストアウェアアクセスの対象に

2025年3月17日、前回コアサービス化していたこともあり、NotebookLMについてもGoogle Workspaceのコンテキストアウェアアクセスの対象に含まれることになりました。IPアドレスやデバイスのシリアル番号、証明書などの条件でアクセス可否を制御することのできる機能で、安全にNotebookLMにアクセスを許可することが可能になります。

故にこの機能についてはGoogle Workspace Enterprise Standard以上で利用可能です。

Google Workspaceで高度なアクセス制限を実現する

マインドマップ作成機能

次項ではChatGPTの機能を使って実現していましたが、2025年3月19日X.comでもNotebookLM単体でマインドマップ作成機能きてるよというので調査してみました。

Google Workspaceアカウントには来ていませんでしたが、個人のGoogleアカウントでは来ていました。マインドマップ作成手順は以下の通りです。

  1. ソースを読み込ませると以前はブリーフィングドキュメントだった位置にマインドマップというボタンがあるのでクリック
  2. 右サイドバーのメモにマインドマップが生成されるのでクリックする
  3. マインドマップが表示され、展開や縮小など自由自在に操作出来る
  4. ダウンロードボタンを押すと現在展開してる状態のpng画像がダウンロードされるので資料で使えます。

余計な外部サービスを使わずに済むので、NotebookLMもどんどん進化していってるなと感じました。

図:マインドマップを作成した

図:マインドマップを表示してみた

図:ダウンロードした画像

ウェブからソースの検出

2025年4月2日、NotebookLMのソースの追加に於いてこれまでダイレクトに特定のURL追加は出来ていましたが、更に関連するウェブのソースを追加することの出来る機能が備わりました。詳細な内容についてはこちらに記載されています。

ソースの追加ボタンの隣に「提供元を見る」というボタンが表示されるので追加する事で関連しそうな内容を自動で検出して追加します。但し、NotebookLMは余計なソースがないことでハルシネーションを抑えるのが1つの特徴であるため、関連するウェブソースを検出した結果、ノイズ情報が増える可能性もあるため、使い方については注意が必要です。

図:このボタンが新機能

画像やグラフも対応

2025年4月2日、これまでPDFソースの場合テキストのみが対象でしたが、PDF内に存在する「画像、グラフなど」のすべての要素を対象に内容を取得しNotebookLM内で利用できるようになりました。よって、プロンプトでグラフ内のデータを読み取っての解答が出来るなどこれまでのテキストのみという制限がなくなります

AI Overviewの日本語対応

AI Overviewは日本では音声概要と呼ばれ、俗にポッドキャスト機能と呼ばれていたNotebookLMの要約した上で、演者二名で送るラジオ番組みたいな構成で内容を会話してくれる機能です。2025年4月29日より、日本語対応しました。50以上の言語に対応したようです。

英語での先行公開されていたものですが、実際に氷河期世代と少子高齢化の未来についての資料を元に、生成してもらいました。NotebookLMの右上にある「音声概要」にある生成をクリックするだけ。テーマに沿った内容をラジオの討論番組みたいに解説してくれるのですが、これはちょっと凄い!!

AIの演者の反応の仕方が、ラジオ番組のそれと同じで、どこからその反応取ってきたんだ?というくらい、ナチュラルな上に内容の要点の掴み方や、ポイントの提示の仕方が昨今の下手なコメンテーターより全然上手い。長年、TBSラジオの深夜ラジオから大沢悠里のゆうゆうワイド、夕方のニュースヘッドラインまでよく聞いていた自分からしたら、自然な上に上手過ぎてビビリました。

ということで、生成したサンプルをアップしてみました。Deep Researchでまとめた氷河期世代と少子高齢化の未来について、二名で会話してる様子が、まさにNotebook LM Radio。

図:この機能メチャすごい

モデルがGemini 2.5 Flashと判明

これまで、NotebookLMはリリース後から今日まで、利用されているモデルが不明でしたが、2025年5月3日に公式のx.comアカウントより「Gemini 2.5 Flashを使っています。伝えるの忘れてました」というメッセージが投稿されました。

2.5 Flashと言っても、2.5 ProのLite版という位置づけでなく思考モデルであるため、その性能は2.0とは比較にならないほどアップしています。複数ステップで推論を重ねて生成されるため、Flashよりも信頼性が高いということですね。

スマートフォン用アプリ登場

2025年5月20日事前の予告通りにスマートフォン用のNotebookLMアプリが登場しました。Web版と違い機能的には控えめで使えないものもありますが、PCとスマフォでの利便性の差があります。

  • Androidユーザは、Google Playからダウンロード可能です。
  • iOSユーザは、App Storeからダウンロード可能です。

Web版との差を列挙してみると

  • スマホ版は音声概要に対してプロンプトで細かい指示を渡すことは出来ません(生成や再生は可能です)
  • スマホ版はソース追加が現在はPDF, ウェブサイト, Youtube, コピーしたテキストのみです
  • ただし、Web版で作っておいたデータはそのままスマホ版で利用することが可能です。
  • スマホ版は細かい機能が未実装です(マインドマップやAnalytics、他者との共有など)。ただし共有されてるものを開くことは可能です。
  • スマホ版は現在、ソース元確認が出来ません

閲覧に特化している感じです。しかし1つスマホ版の利点が、既存のノートブックにウェブのURL追加が楽という点(Web版はChrome拡張機能を使わないと出来ない)

  1. Chromeなどでウェブを開く
  2. 右上の「⋮」クリック→共有をクリックする
  3. 共有先アプリとして、NotebookLMを選択する
  4. 追加先ノートブックの選択画面が出るので、選ぶとソースとして追加される

図:メイン画面

図:ウェブから共有で簡単にソース追加

図:音声概要再生中の様子

音声概要の長さ調整機能

2025年5月20日、英語版のみですが音声概要出力についてカスタマイズから短い、長い、デフォルトの3つで生成される時間の長さを調整できるようになりました。公式x.comのツイートによると、じきに他の言語にも展開する予定とのこと。

  • 短い:5分以上
  • 長い:20分以上
  • デフォルト:10分以上

というセッティングになっているようです。

外部に公開共有する機能

2025年6月3日、作成したNotebookLMを外部に公開し共有する機能がリリースされました。但し現時点では個人のGoogleアカウントで作成したものだけ公開できるようで、Google Workspaceアカウントでは使えません。

ノートブックを開いて、右上の共有をクリック→公開範囲を「リンクを知っている全員」に変更して保存する。この時表示されてるリンクをコピーしたものが公開URLになりますので、一般公開してノウハウを蓄積したノートをもって簡単に外部公開用のチャットボットとしてコンテンツの1つとして公開が出来ます。但し公開リンクを開くためにはGoogleアカウントでのログインは必要です。

一般向けチャットボットサービスは駆逐されてしまうのではないかと・・・

自分も個人アカウントのほうで作ったものを公開してみました。公開されてる内容を変更したりは出来ず、あくまでチャットで問い合わせが出来るだけで、音声概要やマインドマップはオーナーがあらかじめ作成済みの場合は開くことが可能ですが、ゲストが自分で対象のノートに対して作成することは出来ません。

図:外部公開出来るようになりました

Googleスプレッドシート

スプシ分析機能

スプシにおけるGemini for Google Workspaceについて、2025年1月29日、サイドパネルからの指示でグラフやデータの分析が出来る機能が搭載されました。ためしに地震の観測データを単純にグラフ化してと指示してみたところ、一部エラーがあったもののマグニチュードの推移グラフが生成されました。

生成されたグラフはそのまま下の矢印アイコンをクリックすることでスプシに挿入することが可能です。ただしデータにリンクされていないグラフ画像なので数値をいじっても反映されない模様・・・なんか半端だなぁ。

またこの機能はユーザーがスマート機能とパーソナライゼーションをオンにする必要があります。Business Standard以上およびGemini Education, Google One AI Premiumを利用してるユーザが使えます。

図:マグニチュード推移グラフが出来た

スプシ操作系の問い合わせが可能に

2025年5月13日、スプレッドシートのGeminiサイドパネルからこれまで問い合わせて回答という生成AIスタイルに新たに1つ「スプシを操作する」アクションとなる以下のような機能が実装されました。ただし現時点では英語での問い合わせでなければ動作しないようです(英語UIにする必要はありません

  • ドロップダウンの作成
  • ピボットテーブルの作成
  • 条件付き書式設定の作成
  • フィルターの適用
  • データの並び替えの適用

これまでも自分のケースだと、アプリで使う為の「ダミーデータの作成」であったり(ただし10行しか生成できない。CSVだと結構出力してくれる)、難しい数式などを指示をして作ってもらい挿入するというアクション系の生成AIはサイドパネルで活用してきました。

実際に条件付き書式設定を行単位で行うものを指示してみました。

有給残日数のF列が20以上の行に対しては赤でラインの色を変えるという条件付き書式設定です。指示後にサイドパネルに「Apply」というボタンが出てくるので、クリックするとテーブルに対して条件付き書式設定が適用されました。実際に設定を見てみるとバッチリ入っていました(ただ、個人的には範囲が固定化されているので、A2:Gという形で微修正しています。

自然語で苦手なこの手の作業を代わりにやってくれるという機能は待望の機能であり、スプシが苦手な人にとってはGeminiが大いにアシスタントとして動いてくれそうです。

図:条件付き書式設定の適用を指示してみた

図:ダミーデータの生成はちょっとだけ便利

図:難しい関数の数式構築もお手の物

Geminiにてスプシに対してドロップダウン作成指示してみた

シートデータにリンクしたグラフの作成が可能に

前回のアプデ時にスプシ操作系のアクションが装備されたスプレッドシートのGemini for Google Workspaceですが、2025年6月9日に既存のテーブルデータより編集可能なグラフを直接生成する機能が装備されました。

静止画ではなく実際のテーブルデータにリンクしてるグラフなので、データを変更すればグラフも変動します。その最初の一歩である結構面倒なグラフ作成をサイドパネルからの自然語にて作れるのは大きな一歩です。

現在は英語UIにしなければ利用が出来ませんGoogle Workspace Business Standard以上で利用が可能です。試しに、既存のテーブルに対して英語でプロンプトを入れて作ってみてもらいました。X軸に商品名、Y軸に価格を取った棒グラフを生成させています。

但し、元データから該当の列のデータは別途切り出された上でグラフが作成されるので、この点が難点。既存データのまま作ってほしいなぁ。

グラフを生成して挿入する生成AI事例

Googleドキュメント

コンテンツ要約ブロックの追加

2025年3月17日、GoogleドキュメントにGeminiによる文書の要約のブロックをスマートチップで挿入できる機能が装備されました。要約であるため、通常は本文の上部に挿入するのではないかと思います。

この機能は、すでに文章が存在してるファイルに於いて、冒頭にて@summaryと入力して選択するか?メニューより挿入→構成要素の中にあるAIサマリーを入れるだけ。勝手に要約文ブロックを作ってくれます。

公式のドキュメントはこちら。文書作成のルーチンの1つに加わりそうです。この機能は現在、UIが英語でなければ利用することができません

図:Gemini要約を上部にブロックとして追加してる様子

Googleドキュメントにコンテンツ要約ブロック機能が追加

より高度なドラフト作成機能

これまでのGoogleドキュメントのHelp me createは単純にプロンプトに入れた内容に基づいて作成するだけでした。

  • 画像を生成する
  • 文章を作る

本格的なドキュメントに仕上げる為には人間がこの内容をドキュメントに挿入し、手直しを相当かけて提案書などを作っていました。しかし、2025年3月31日発表の内容によると、プロンプトの内容に基づいて

  • カバー画像やインライン画像を含めたドキュメント生成
  • 年表などを含めたドキュメント生成(ベースになる他のファイルを指定可能)

また2025年4月7日に、日本語対応でのHelp me Writeがパワーアップし、この作業をプロンプト一発で行えるようになったようです。これまでの単純な生成だけじゃなく一歩先に進んだイメージですね。ページレスドキュメントだけが対応しており、Google Workspace Business Standard以上で利用が可能です。

サンプルで作成されたドキュメントはこちらです。プロンプトとしては「会津藩の西郷頼母の歴史について記述してください。カバー画像は戊辰戦争をイメージしたものを挿入してください。年表や最後どうなったのか?までのストーリーがあると良いです」 という簡単なもの。

図:日本語でカバー画像含めて作れる

 

図:作成されたドキュメントがなかなか

Geminiでドキュメントの下書きを作ってもらった

Android版でも利用が可能に

Android版のGoogleドキュメントにおいても2025年6月9日、Gemini for Google Workspaceが利用可能になりました。Gemini in Docsと呼ばれ、モバイル版は現在画像生成やドキュメント生成自体は出来ません。

本機能はGoogle Workspace Business Standard以上で利用することが可能です。

図:スマホでも使えるようになりました

Gmail

モバイルGmailにやり取り結果を挿入

2025年2月7日、スマートフォンに於いてGeminiを利用し、やり取りした結果をGmailに挿入するという機能が装備されました。PC版ではなくスマフォなので手順としては

  1. スマフォのGmailアプリを開く
  2. 上部にある「Geminiアイコン」をタップして、やり取りをする
  3. やり取りした結果、Androidの場合は右下の斜め矢印のアイコンをタップする(iOSだと挿入ボタンになるようです)
  4. Gmailで新規メールが立ち上がり、内容が挿入される
  5. スレッド内での質問の場合は、そのスレッドの宛先やCCなども自動で挿入されるようです。

この機能はGoogle Workspace Business Standard以上で利用が可能です。

図:やり取り結果に基づいてメールを作る

Gmail→カレンダーに予定を追加する機能

2025年3月10日、Gmailの画面からGemini for Google Workspace経由でGoogle Calendarに予約を追加する機能が装備されました。プロンプトをいれるのではなく、Gmailの対象のスレッドを開くと、サイドバーの中にGoogleカレンダーへの追加のボタンが表示される仕組みのようです。

現在この機能は言語が英語の場合でのみ利用することが可能です。またGoogle Workspace Business Standard以上で利用することが可能です。ただし、メール本文内で予定が既に確認できてると判断されるとこのメッセージは出ないようです。また、スマートフォンでは現在はまだ未対応のようです。

2025年4月9日日本語環境でもカレンダー参照や予定の作成依頼を行うことができるようになりました。

2025年5月19日、モバイル版Gmailからも同様の機能が使えるようになりました。

図:サイドバーにカレンダーのアクションが表示された

GmailのGeminiサイドパネルからカレンダー予約を入れる

高度な下書き作成機能

2025年4月7日、GmailのHelp me writeに於いて新規作成画面上から、より高度なメールの下書きを作成できる機能が追加されました。公式ドキュメントはこちら左下にHelp me Writeのボタンが出てきたら展開されているので使ってみましょう。

試しにサイドバーからは「Cloud Next Tokyo 2025において、自社ブースで様々なイベントやノベルティの配布があるので、お客様にお誘いのメールを作って欲しい」で作ってみてもらいましたが、なかなか良い文章に仕上がってるので、ここを少し改造してあげれば、体裁の整った下書きが出来上がりますし、さらに突き詰めてより明確な下書きに仕上げて挿入できます。

Business Standard以上で利用ができ、今回のアップデートで日本語も対応したようです

図:新規作成でドラフトを作ってる様子。

図:これまでもサイドバーで作ることはできました。

Android版Gmailでも画像生成して挿入

現在、Web版のGmailではサイドパネルで画像を生成してそれをそのままメールに添付して送信といったことが可能になっていますが、Android版では生成は出来ても一旦保存するしかありませんでした。2025年4月25日、AndroidおよびiOS版でも同様に画像生成してサイドパネルから直接下書きに挿入するといったことが出来るようになったようです。

本機能は、Google Workspace Business Starter以上で利用することが可能です。

図:Web版ではこんな感じでダイレクトに挿入可能

Google Meet

Meetの自動メモ生成で次のステップ提案機能

2025年2月18日、Gemini Business以上に於いてGoogle Meet上でのTake me note(議事録を取る機能)に於いて、MTGが終了し作成が完了した後に、このMTG後のフォローアップや次のアクションが提案される機能が搭載されました。

ただ、日本の場合そもそも日本語でこの機能がまだ提供されていないので、提供開始となっても使うことは出来ません。Business Standard以上のプランで利用可能です。

図:ドキュメント上で提案がなされるようだ

Meetで日本語の会議議事録作成機能が公開

英語版では先行してリリースされていたMeetの会議議事録機能であるTake me noteですが、2025年3月12日ついに日本語で議事録が取れるようになったようです。これで議事録作成業務から人間は今日解放されることになるかもしれません。

これまではTactiqRead.AIなどのサードパーティを契約して仕方なく使っていた日本語での会議議事録取得機能ですが、Meet単体で利用できるのであればよりいっそうGoogle Workspaceにサービスを寄せて他のWebサービスの断捨離が進みそうです。

作成時間推奨値は15分から8時間ということなのですが、十分すぎる。MTG終了後に会議主催者のGoogle Driveにドキュメントの形で生成されてメールで通知が来るので待ちましょう。

この機能はGoogle Workspace Business Standard以上で利用することが可能です。管理者向けの機能のオンオフに関する公式ドキュメントと、ユーザ向けのドキュメントをよく読んでから使いましょう。

議事録作成は主催者が右上の鉛筆アイコンをクリックするだけで開始され、あとでメールでGoogleドキュメント形式のものが返ってきます。そして議事録が取れるようになったということは、NotebookLMにて生成された議事録を蓄積し、解析したり要約が後で可能になるということ。

使ってみた感想と議事録の内容ですが

  • メモタブ:会議の概要まとめと詳細要約が整理されて記載されています。メモ記載のタイムスタンプをクリックすると、文字起こしの該当の時間にジャンプします。
  • 文字起こしタブ:MTG内の全部の音声文字起こしがなされます。フィラーワードも残ってしまう・・・発言時間、発言者、内容の3項目で1セットで記録されています。
  • ページレスで見出し折りたたみの状態で作成されます。メモと文字起こしはドキュメントタブで分かれて構成されています。

というシンプルな構造。議事録のサイドパネルで更に要約してみたり、QAとしてまとめたりが流れ作業で可能です。またGoogleドキュメント形式なのでNotebookLMに蓄積して、これまでのPJの全MTGを通しての要約にしたりマインドマップを作ったりすると捗るかもしれません。

現時点では

  • 設定の会議の記録にて、日本語指定していないと、英語で文字起こしされてしまう。必ず最初に明示的に日本語指定が必要です(ここに日本語がない場合、まだ展開されていないです)
  • 発言者の日本語の漢字がオカシイ部分が若干ある
  • 主催者以外メモ取り開始は出来ない
  • 録画のようにMTGで自動録画開始のセットなどはまだ出来ないので必ず手動で文字起こし実行が必要
  • グループ指定してると会議メモが届かなかったりアクセス出来なかったりするケースがある(参加者はグループで指定しない方が良い)

実際に議事録を取ってみた内容のサンプルを作ってみました。サンプルなので綺麗ですが、人名の漢字が異なっていたり、おかしな言い回しも若干含まれるので、Geminiに食わせて文章校正などを追加で施すと良いでしょう。

※現在生成されたDocumentに対してGoogle Apps ScriptにてopenByIdで開こうとするとエラーが発生する模様(ファイルを移動させても同様の症状)

図:ついに日本語で議事録取れるようになった

図:日本語で設定をするのを忘れずに

図:MTG入る前のメモ作成通知画面

図:メモ取り失敗した時の通知

図:文字起こしの様子

図:Geminiで文字起こしした旨のメッセージ

図:GASからは何故か呼び出せない

Notebook LMで自分だけの専用生成AIを作ろう

背景画像生成機能ほか

2025年3月11日、日本語環境では使えなかったGoogle MeetのGemini機能の多くが使えるようになりました。

  • 背景画像生成機能:但し日本語が通らないので英語で入力が必要
  • スタジオサウンド:ノイズリダクション的な機能を生成AIが担当する。
  • スタジオ照明:プレゼンターに当たる照明の強度や色を変更することが可能
  • スタジオルック:プレゼンターの映像のノイズを低減する
  • アダプティブオーディオ:近接したPC同士でのハウリングやエコーを防止する機能(2024年6月リリース)。使い方はこちらを参照しましょう。

スタジオ照明は確かに部屋のレイアウトによって天井の照明の力が弱く暗く写ってしまった時には便利といえば便利なのですが、ちょっと力不足を感じる。故に自分の場合は物理のモニターにひっかけるバー型のモニターライトを使っています。生成AIが進歩すればこういった物理ハードもいらなくなっていくのかもしれない。

図:背景画像生成機能

議事録機能と字幕機能で多言語対応

2025年4月17日、今年リリースされたばかりの議事録機能と字幕機能において、多言語サポートが装備されました。カレンダーの招待状上から言語指定ができるようになり、スマートフォンでも対応しています。色々な国の人が参加する会議では役に立つでしょう。

どうように録画された会議動画の字幕に於いても同様に、言語指定が可能になっています。この機能はGoogle Workspace Business Standard以上で利用することが可能です。

図:会議の記録オプションに新規に追加

図:スマフォ対応もしてる

Google Chat

サイドバー対応が始まる

2025年3月18日、これまで日本語環境では未対応であったGoogle Chatに対するGemini for Google Workspaceのサイドパネル対応が日本語環境でも利用可能になるようです。

まだ自分のテナントでは英語UIに変更しないと使えませんが、これによりChat内容のサマリーを作成したり、特定アイテムの探索などGoogle ChatでもGemini for Google Workspaceの恩恵を受けることができるようになります。

本機能はGoogle Workspace Business Standard以上で利用が可能です。

図:ChatでもGeminiが使えるように

チャット内ファイルの要約

サイドパネル対応と同時に2025年3月18日、チャット内で添付されたファイル(ドキュメント、スプレッドシート、スライド)について、summrize this fileのボタンが付くようになりその場でクリックすることでサイドパネル内に要約表示されるようになりました。

開くこと無く要約状態でプレビューできる機能といった感じです。本機能はGoogle Workspace Business Standard以上で利用が可能です。

図:添付ファイルのサマリーをサイドパネルで表示

未読チャットの要約

2025年5月30日、Google Chatにおいて未読スレッドの要約がホーム上から実行できるようになりました。サイドパネルから操作せずともワンクリックで実行可能になったので、未読が溜まりがちな人にとってはショートカットのような働きをします。

本機能はGoogle Workspace Business Standard以上で利用することが可能です。公式ドキュメントはこちら

図:スレッド上に要約ボタンが出てくる

Google Vids

VidsのAI音声読み上げ機能

Google Vidsの動画作成機能に於いて2025年2月28日、入力した文章をAIが指定のパターンで読み上げして動画のナレーションとして追加することの出来る機能が公開されました。

この読み上げパターンがナレーターであったり、先生であったり説明者であったり色々なパターンが用意されるようですが、現時点では読み上げは英語のみの対応となっているようです。Business Standard以上のプランで利用可能です。

公式のドキュメントはこちらにあります

スクリプト欄の下にVoiceoverという欄が出てきてそこからクリックしてパターンを選ぶようです。

図:Voiceoverからパターンを選択する

Veo2による動画生成機能解放

Google Cloud Next 25ではアナウンスがあったGoogle Vids上でVeo2による動画生成が2025年5月6日、ついに解放されるようです。すでに先行して、YoutubeショートやGemini Advancedの特定のユーザにはVeo2がチャット上で提供されていますが、ついにVidsにも来るとなると動画作成が一気に広がりそうです。公式ドキュメントはこちら

仕様は、16:9の720p・24fps、8秒間の固定で生成が行われ、Google Workspace Business Starterから利用が可能になっています。作成できる本数制限は1日20本までで、特に追加費用なし(Gemini APIで使うととっても高額です)。

使い方ですが、以下のような手順で生成することが可能です。但し現時点では英語UIにしないとこの機能は使えません。またプロンプトも5ワード以上で英語での指示でなければ現在は通らないようです。

  1. 右側のパネルの一番上にあるGenerate a videoのボタンをクリックする
  2. プロンプト欄のサイドバーが出てくるので、ここに生成したい動画のプロンプトを入力してCreateボタンをクリックする。
  3. 動画がパネル内にまず生成されるのでカーソルを合わせる
  4. Insertボタンをクリックすると現在アクティブになっているタイムラインに挿入される(ここ注意)

英語UIはマイアカウントから変更出来ます。生成までおおよそ30秒程度。Edit Promptから再度指示は可能ですが、1日の生成リミットがあるので思いつきで何度も試す前に、最適なプロンプトとは何か?を練ってから指示出しするようにしたほうが良いでしょう。

図:動画をプロンプトから生成してる様子

図:日本語だと生成が出来ません

図:動画が無事に生成されました

🎬️ Google Vidsにも動画生成AIのVeo2が公開されたよ

Veo3による動画生成機能解放

前述のVeo2の次バージョンであるVeo3のプレビュー版2025年6月9日、早速Google Vidsにて利用が可能になりました。現在まだ、Veo2同様に英語のUIに変更しないと利用することが出来ません。また、英語でのプロンプト指示でなければ使うことは出来ません。

Veo2も並行して利用が可能で、新たにモデル選択のプルダウンが付いています。

Veo3では制限として1日に10本までの動画生成となっています。動画解像度は16:9, 720p, 24fpsの8秒間という設定に変更はありません。Veo3は音声も自動生成して含まれるようになっているので、不要な場合は挿入後に対象の動画の音声部分をミュートすると良いでしょう。

本機能はGoogle Workspace Business Starter以上で利用することが可能です。

図:さらにVeo3が使えるようになっています

図:Veo3の実力

Googleスライド

Googleスライドで使えるようになりました

これまで日本語の環境ではGoogleスライド上でGemini for Google Workspaceが利用できませんでした。2025年3月5日、ついに日本語対応してサイドバーが表示。またスライド作成サポートというボタンも表示されるようになりました。

但し、今回のサポートによってドキュメントではできていた人物の生成については未サポートのようです(イラストは出てくる)。自分のテナントは来ているのですが問い合わせの言語は日本語未サポートと出る。あくまで使えるようになっただけで、問い合わせ英語でなければならない模様・・・

このスライド作成ボタンはメニューバーの左上に存在してるのですが、クリックすると適当な文言がGeminiのサイドパネルに入る。あくまでも例題みたいなのがランダムに入るだけみたい。

Business Standard以上のプランで利用可能です。

※但しまだ1枚切りのスライドしか生成できません。将来的には複数スライド一括作成が予定されてるようです。

図:とりあえず使えるようになった

図:スライド挿入画面

Google Apps ScriptでGeminiを叩いてスライドを生成する【GAS】

Google Drive

ドライブでフォルダやファイルを作る

2025年3月10日、Google DriveのGemini for Google Workspaceのサイドバーから指定したファイルやフォルダを作成する機能が追加されました。ファイルの場合ドキュメント、スプレッドシート、スライドを作成することが可能です。

ただまだ自分の環境に展開されていないのか?テストしてみましたが「Sorry, I can't help with creating folders yet, but I'm still learning.」と返されてしまいました・・・

Google Workspace Business Standard以上で利用することが可能です。

PDFに対して問い合わせ

2024年7月30日英語版として先行リリースされていたPDFファイルを直接開いた時にもGeminiサイドパネルが出て、問い合わせする機能。この機能が2025年3月26日に日本語環境でも利用可能になりました。

合わせて現在ドライブ上でPDFを開くとドライブ上でオーバーレイの形で表示されてるPDFが、新しいタブで直接開くように設定変更もできるようになったようです。

現在まだ自分のテナントは英語UIにしないと使えませんでしたが日本語は通り、要約といった基本的な事からここから内容を読み取って解説しろ的な問い合わせも可能になりました。表を読み取るであったりPDFの結合なんかもできるらしい。

PDFの新規タブで開く設定は右上の歯車アイコン→全般の中にあるPDFを開くにて設定が可能です。

図:日本語が通るようになった

図:PDFを新規タブで開く設定

特定の対象物に対してだけ問い合わせ可能に

特定ファイル

2025年5月1日、Google DriveのサイドパネルにてGemini for Google Workspaceを使って、特定のファイルについてだけ追加して問い合わせを行うことが可能になりました。これまでは漠然とサイドパネルから、調査するといったことやファイルを作ると行ったことしか出来ませんでしたが、これによりNotebookLMのように特定ソースについてのみの問い合わせが実現します。

ファイルは複数同時に追加することが可能で、ファイルを選択後にAdd from Driveをクリックするとパネルに追加されるので、あとはプロンプトを投げて中身を元に色々指示を出すことが可能です。ドラッグアンドドロップでも行けるみたい。

この機能はGoogle Workspace Business Standard以上で利用することが可能です。

図:特定のファイルについてだけ問い合わせ可能に

特定フォルダ

2025年5月12日、Gemini for Google WorkspaceのDriveにおいて、1日にリリースされた特定ファイルに対してだけでなく、特定のフォルダに対して問い合わせが可能になりました。日本語で問い合わせできるとありますが、現時点では英語UIでなければ利用することが出来ません。

対象フォルダを右クリック→Summurize this folderであったり、ask about this folderであったりが実行でき、そこから内部のファイルについて開くことなく問い合わせすることが可能になっています。

図:フォルダ単位での問い合わせが可能に

問い合わせ結果をエクスポート

Driveのサイドパネルでのやり取り結果について、2025年5月16日Googleドキュメント・スプレッドシートでエクスポートする機能が装備されました。例えば、条件に合うファイルの一覧を生成してもらって、そのファイルのIDやURLをリスト化→スプシで出力なんて使い方ができるかもしれない。

サイドパネルのやり取りは共有出来ず、履歴も残らないので他の人と継続して仕事をする場合にはファイル化したいという要望があったのかなぁと思います。

この機能はGoogle Workspace Business Standard以上で利用することが可能です。公式ドキュメントはこちらから。

図:やり取り結果をファイルで残しておく

動画に対して問い合わせ

2025年5月28日、Google DriveのGeminiサイドパネルに於いて、動画に対する要約指示や内容の問い合わせが可能になりました。自分の場合研修動画をよく作成しているので、作成した動画からトピックを抽出して、Google Sitesに掲載するといったような二次的な利用をしています。

公式ドキュメントはこちら

この機能はGoogle Workspace Business Standard以上で利用することが可能です。

図:研修動画には結構ハマる内容かもしれない

ファイル変更を調べる機能

2025年6月3日、Gemini for Google WorkspaceのGoogle Driveサイドパネルに於いて、「Catch me up」と呼ばれる機能が搭載されました。

この機能なんなのか?と言ったら、対象のファイルに対する変更履歴やコメントの追加、ドライブ全体の変更情報の概要、変更された際の差分表示などを行うことが出来るようになり、最後に表示した時からのファイルの改変について包括的に知ることが出来ます

使い方ですが、

  1. Driveのホーム画面を表示する
  2. 上部にCatch me upボタンが出てくるのでクリックする
  3. サイドパネルが開かれて、アップデート情報が取得できる。
  4. もしくはGoogleスプレッドシートやドキュメントのファイル名の隣に表示されてるGeminiのアイコンをクリック
  5. すると対象ファイルについての変更履歴等の情報を包括的に知ることが出来ます。

本機能は現時点では英語UIにしていないと使うことが出来ません。Google Workspace Business Standard以上で利用することが可能です。ファイルに対するcatch me upは日本語ファイルでは現在まだ未サポートのようです。

リアルタイムでのファイル変更情報をキャッチしたいといった要望は、GASとDrive APIを使って仕組みを作れば実現は可能ですが、この機能はそういった機能ではないので注意。

図:catch me upで履歴を取得してる様子

図:ファイルに対するcatch me up

図:ドライブ全体に対する変更履歴を取得

Google Driveの更新通知を受け取って記録を取る【GAS】

PDFビューアにサマリーカード表示

2025年6月12日、Google DriveでPDF表示をした際に、サイドパネルのGeminiアイコンをクリックすると最初から自動的に要約を表示するカードを装備しました。もちろん、前述にもあるようにそのまま、続けてPDFに対してGeminiで問い合わせを実行することが可能です。

この機能はGoogle Workspace Business Standard以上で利用することが可能です。

いちいち要約してと入力するというおまじないみたいなことをせずに初められるのはよい点かもしれません。

図:自動的に要約表示されるようになりました

Googleフォーム

解答のサマリー作成

2025年6月10日、GoogleフォームのGemini for Google Workspaceにおいて、フォームの回答データからボタン一発でサマリー作成機能が装備されました。プロンプトで問い合わせ等は出来ません

現在は、英語UIにしないと使うことが出来ません。また、Google Workspace Business Standard以上で利用することが可能です。

ボタンは、フォーム編集画面において、上部のResponsesをクリック→Summaryタブ内の一番下に解答が列挙されてる所にて、Summarize Responsesボタンをクリックするだけ。

図:ボタン一発で解答全部から要約作成

フォーム作成支援機能

Google Workspace Labsの機能としてはリリース済みであったHelp me a create form2025年6月11日、この機能が正式にGeminiの機能として公開されました。すでに昨日の時点で見えていたので、あれ?とは思っていたのですが。

但し現状は英語UIでなければ利用することが出来ません。また、Google Workspace Business Standard以上で利用することが出来ます。

利用方法ですが、以下のような感じになります。

  1. 英語UIの状態で、こちらのサイトにアクセスする
  2. Blank formにて新規作成を行う
  3. 上部にあるアイコンのHelp me create a formをクリックするとダイアログが出てくる
  4. 入力欄があるので、ここに作ってもらいたいフォームに関してGeminiに問い合わせ実行。旅行プランフォームを以下のようなプロンプトで問い合わせしてみました。
  5. 候補がプレビューで出てくるので、良さそうであれば、そのままCreate formボタンをクリックする
  6. 作成されたフォームの選択肢の内容等を微修正して完了。但し英語で作成されてしまってるので、現状はだいぶ修正が必要です。

フォームにどんな質問内容を作ったら良いのか?といったアイデア出しであったり、その項目をどんな質問パーツで構成したら良いのか?慣れていない人にとってはハードルです。こういった初めの作り出しのハードルを簡単に乗り越えられるようになります。

図:フォームをGeminiで作成できます

図:作成された候補

図:実際に作成されたフォーム

Gemini Advanced

拡張機能の名前がアプリになる

2025年3月8日に、これまでGemini AdvancedのGoogle Workspace連携について「拡張機能」と呼んでいたものが「アプリ」に名称変更されました。

ただなんだかなんでもアプリアプリ呼称するのがちょっと・・・このGemini Advanced自体もアプリな理由でして・・・連携機能といったような名称でも良かったのではないかなと。

2025年5月13日、β版であった本機能が一般公開となりました。

図:この名前変更はどうだろうか?

Geminiアプリでファイルアップ対応

スマートフォンのGeminiアプリに対して、2025年2月20日ファイルのアップロード機能として以下のものが対応したようです。個人のGoogleアカウントでも利用できるようです。

  • doc, docx, pdf, rtf, dot, dotx, hwp, hwpx, pptx
  • Googleドキュメント、Googleスライド
  • TXTファイル

主にオフィスファイルのアップロードに対応したよということですが、自分のスマフォにはまだ更新が降ってこない。

KeepとCalendarと連携機能

2025年1月30日、Google Japan Blogの方で発表がありましたがGemini AdvancedにてGoogle KeepおよびCalendarの連携機能が発表されました。これは以前2024年10月21日発表に於いて追加されるかも?とあった機能であると思われます。

ToDoリストについても追加済であり、チャット上からKeepのリストを作成したりカレンダーに予定を追加したりといったことが会話の流れで出来るようになったようです。

KeepについてはHelp me create listがアプリの側で英語版ですが一部のユーザに展開されているようです。個人のアカウントでは既にカレンダー接続して「以前のオイル交換時」といった問い合わせが可能になっており、カレンダーに記録を残しておくことで、そう言えば前回はみたいなケースで色々と漁る必要性が減るかもしれません。

ただ、まだカレンダーの中身までは読み取ってくれないようなので、中身を記述してもそこはスルーされてしまうようです。前回のオイル交換時のカレンダーは見つけてきてくれるので、自分でクリックして開くことになります。

図:Gemini連携アプリが追加されました

図:過去のカレンダーを探索してくれる

Geminiモバイルアプリでもカレンダー対応

2025年4月4日、GeminiのモバイルアプリでもGoogle Workspaceアカウントに於いて、Googleカレンダーの探索と問合せに対応しました。ただし、カレンダーのタイトルしか見てくれないので、カレンダーの詳細に記述してあっても、そこはGeminiが読み取って返してくれるわけではないようです。

図:モバイルでもカレンダー読み取り対応

Gemini 2.0 Flashが対応

2025年1月31日Gemini Advancedに於いてこれまでは有料版で使えていたGemini 2.0 Flash対応が無料ユーザでも利用可能になったという発表がありました。

またこのアップデートによって100万トークン、1500ページのファイル読み込みに対応し、Deep Researchに対応、画像生成はImagen3に対応とのこと。

画像だけじゃなくVeoにて動画生成もおそらく近い将来提供されるようになるでしょう。以下のエントリーではImagen3 APIを使ってスライドに画像生成をする仕組みをGoogle Apps Scriptで実装しています。

GeminiアプリについてもGemini 2.0 Flash対応になりました。

※Geminiアプリについて2025年3月8日に、2.0 Flash Thinkingにアップグレードがなされました。

図:本人は知らないと言ってるけれど

Deep ResearchとGemsが使えるようになる

2025年2月18日、これまで一部の人に実験モデルとして提供されていたDeep Researchの機能が、モバイルアプリおよびデスクトップで提供開始とのこと。ただし、現状ではGoogle Workspaceユーザではなく個人でGoogle One AI Premiumを契約しているユーザに対してだけ提供という形になっています。

Google Workspaceユーザに対してはちょっと遅れて2025年2月20日より提供開始となりました。同時に、Gemini 2.0 Flash Thinking Experimental、Gemin 2.0 Pro Experimentalもリリースされており使えるようになっています。上部ロゴをクリックすると選択することが出来、またスマフォからも利用可能になっています。

Deep ResearchとはChatGPTも出してきてる機能で、これまでのようなChatで1:1で質問にただ回答を返すというだけではなく、質問内容を深く分解し、資料を収集・調査し、レポートを生成するまでの流れを人間がPDCAを回すように作成してから返すAIエージェントと呼ばれるもので、本来追加料金で結構な金額を支払って使う機能になります。

2025年3月13日Business Starterでも本機能が使えるようになりました。Gemsについても同様です。無償のGoogleアカウントでも同様にDeep ResarchとGemsが利用可能になったようです。

2025年3月18日、Deep Researchが使える回数が2倍になったようです。

2025年4月11日、Deep ResearchがGemini 1.5からGemini 2.5 Proへアップグレードされました。

2025年5月2日、GWSユーザもGeminiモバイルアプリでDeep Researchが使えるようになりました。

2025年5月2日Gemsに対してファイルアップロード機能が追加されました。

※おなじくGemini for Google WorkspaceのサイドパネルにてGemsが使えるようになっていました(ただし英語UIでなければ出てこない)

図:新機能がGoogle Workspaceでも利用可能に

図:DriveのサイドパネルからGemsが使える

NotebookLMの音声概要(AI Overview)が使えるように

これまでNotebookLM上でアップした資料からポッドキャスト的に音声読み上げをしてくれるAI Overviewが英語としては利用出来ています(まだ日本語対応されていない)。

2025年3月18日、このAI Overviewの機能をGemini Advanced上から利用可能になるアップデートが発表されています。Deep Researchした結果を音声で聞いたり、Gemini上で指定したファイルに対してGenerate Audio Overviewのボタンが出てくるのでクリックすると、音声読み上げされるようになるといった感じです。

単純な読み上げだけならばこれまでも「読み上げる」にて出来ていましたが、ここに新たにAIを介して解析した内容を読み上げることができるようになり、日本語対応が待ち望まれます。

2025年3月31日、モバイル版でもこの機能が利用可能になりました。

Deep Research with Audio Overview

Canvas機能が装備

ChatGPTやClaude3では既にもう実装済みの機能でSNS上でも盛り上がってる「Canvas機能」。2025年3月18日、この機能がGemini Advancedにも到来しました。すでに日本語環境でも利用可能になっています。公式ドキュメントはこちらになります(ClaudeではArtifactsと呼ばれてる機能に該当します)。モバイルアプリではまだ利用出来ません。

そもそもCanvasとはどんな機能なのか?

  • 文書をアップやドラフトを作成後、サイドパネルを介してフィードバックしながら内容をブラッシュアップすることが可能です(ブログの内容を校正したり、更に内容をグレードアップを何度も行う為に使います)
  • Webアプリやプログラム、ゲームのプロトタイプを生成し、サイドパネルでプレビューしながら指示を出して改良していくことが可能です(例えばGASのウェブアプリでVue+Vuetifyを使ったアプリのスケルトンを簡単に用意して修正までできる)。
  • またスマートフォン向けアプリのデザインを指示してレイアウトなどを考案することが可能です。
  • リッチなプレゼン用資料やSVG画像の生成、ダイアグラムなどのチャート類の生成などが可能です。

これまでClaudeが先行していてGeminiユーザは指を加えて羨むしかなかったわけですが、ついにこの大型のアップデートが来たといった感じです。試しに自分も「ponというゲームを作って」と頼んでみたらあっという間に作成。そのままプレビュー画面で閲覧もできる。ここからコードの調整やPythonなどであればGoogle Colabにエクスポートするなど出来てしまう。

オリジナルのponを改良してみましたが、これはヤバイですね・・・

本機能は個人のGoogleアカウントやGoogle Workspaceの全プランで利用が可能になっています。

図:ponを作ってもらってみた

図:SVG形式のダイアログラムを作ってもらった

図:GeminiでもCanvasが使えるように

Personalizationが使えるようになる

2025年3月13日、Gemini 2.0として新たにAdvancedでPersonalizationと呼ばれる「過去のGoogle検索履歴に基づいた」個人にあった内容を返すというモデルが追加されました。現在はまだ個人アカウントにのみ展開されていますが、今後Google Workspaceアカウントにも展開されていくものと思われます。

初回はGoogle検索履歴への接続を求められるので接続を実行し、あとは通常通りGemini問い合わせをするだけ。

この機能によって、例えば自分がいつも検索している地域や趣味嗜好、パターンなどを優先的に取り上げて処理を行うようになるため、より個人に適した解答に近づけようという試みのようです。

例えば地域だと位置情報の要求が来るので許可を与えると、自分が済んでいる地域で絞って解答をよこしてくれるようになります。

図:新たに増えた個人向け機能

図:まずは接続が必要になります。

図:地域に即した解答が出てくる

Gemini 2.5 Proがリリースされる

2025年3月25日、実験的リリースとしてGemini AdvancedにてGemini 2.5 Proがリリースされていて、Google Workspaceアカウントでも利用が可能な状態になっています。問い合わせに対して即答する前に一度考えてから解答を行う推論モデルとなり、長文読解であったり、 プログラムのコーディングや数学的処理に向いているとのことですが如何に。

Flashのような日常的な問い合わせというよりも、より専門的な領域に於いて複雑な処理をやらせる場合に使えるということなので、VBA→GAS変換などで過去に取り組んでいましたが、ちょっと使ってみようかなと思います。

APIとしてGASから使ってみましたが、字幕生成では1.5 Flashと比較して格段に向上していました。

2025年3月28日、Google Workspaceユーザもスマフォ版Google Geminiアプリで使えるようになりました。

2025年6月5日、Gemini 2.5 Proがメジャーアップデート。より強力になりGeminiアプリで使えるようになりました。1日あたりの送信プロンプト量制限が、50→100に倍増もしています。

図:選択肢に増えています

図:モバイル版でも使えるようになりました

Google Apps ScriptでGeminiを叩いて音声から字幕生成【GAS】

Geminiを使ってVBAからGoogle Apps Scriptに変換する仕組みを作る【GAS】

モバイルでもファイルアップロード

2025年3月28日、Geminiのモバイルアプリにて端末内のファイルをアップロードしての問い合わせが可能になりました。もともとウェブ版では出来ていたことですが、スマートフォンで完結できるようになりつつある。

但し、PNG画像は未対応でPDFは対応してるなどファイル形式による差があったりして、ちょっと使いにくいのが現状。

図:端末内のファイルをアップロード

Google Workspace拡張機能がデフォルトでオン

Geminiアプリはこれまでβ版扱いでしたが、2025年4月2日より一般提供開始となるにあたって、Google Workspaceの管理コンソールに於いて、これまで拡張機能としていたGoogle Workspace連携するアプリ機能デフォルトでオンとなります。任意に手動でオンとしていたものがデフォルトでオンとなることで、予期しない利用が発生する可能性があるため、Google Workspace管理者は対応を行う必要があります。

設定箇所は

  1. 管理コンソールを開く
  2. 左サイドバーの生成AI→Geminiアプリを開く
  3. 右パネル一番下の「アプリ」をクリックする
  4. Workspace アプリの中にAllow access to Workspace appsがチェックされる

図:ここが既定でオンになります

図:ここがデフォルトでオンになります

Veo2が一般公開

2025年4月15日Google One AI Premium加入者向けにAdvancedにてVeo2の動画生成機能が公開されたようです。ChatGPTのSoraに対抗する動画生成AIになります。動画生成となるとLuma Dream MachineRunway Gen-3Adobe Fireflyなどもターゲットになります。

Google AI StudioGoogle Whiskでもリリースされており、先行してYoutubeでもショート動画作成でVeo2は公開されています。年内にはGoogle Vidsに対してもVeo2による動画生成機能が搭載されるというアナウンスも出ています(Google Cloud Next '25で発表)。Whiskから使う場合にはこちらから利用が可能です。

CNETの記事ITMediaの記事よるとSoraには劣るということのようですが、そもそもまだまだ動画生成AIというジャンル自体が一般的ではないのと、一番ホットな話題であり、自分も期待してる領域なのでこれがGoogle Advancedから使えるとなると、意味が異なってきます。Youtubeでの動画作成が一層捗りそうです。

ただ現状では最大8秒間の動画生成であり、ショート向けの縦動画は生成できない。また月間で利用できる回数も限られているので、現在はワンシーンのイメージ動画などで使えるのではないかと思います。

※Veo2 APIも公開されていたので使ってみました。ただしかなり高額なAPIなので実行注意

2025年5月6日、Google WorkspaceアカウントにもモバイルアプリにだけVeo2が来ました。しかし動画は作れないという・・・

2025年5月9日、Google WorkspaceアカウントでもVeo2が利用可能になりました。制約は1日5本までらしいですが、明記がない(VidsのVeo2は1日20本までと明記)。Google AI StudioのVeo2も5本程度/1日のようです。

2025年5月10日、再び使えなくなって普通のチャットに戻ってる・・・

図:ついにGWSアカウントでも使えるようになりました。

GeminアプリのVeo2でキノコの動画を作ってもらった

図:Veo2でキノコの動画を作ってもらった

Node.jsでGoogle Veo2 APIを使って動画を生成してみた

図:Whiskでアニメーション作成する様子

図:モバイルアプリにVeo2が来たけど・・・

Google DeepMind’s Veo 2: The AI Video Model That’s Breaking Reality

Bring Your Images to Life with Whisk Animate

Gemini 2.5 Flashがリリースされる

2025年4月17日Gemini 2.5 FlashがAdvancedにて登場しました。Proが先行してリリースされていて、APIでもその性能の高さから、評判が良いですし自分自身も2.0まででは実現出来なかったことが無事に達成できたので、今いろいろ試しています。

2.5 Flashはどうなんだ?というと、これまでと同様に速度とコストを重視したライト版のような立ち位置になります。Proは高度で高機能なのですが、どうしても速度面やコストではちょっと多めに掛かります。通常の問い合わせやら作業はFlashで、高度な変換やコード生成みたいなものはProでと使い分けをすると良いでしょう

先日リリースされたCanvasも2.5 Flashで利用が可能になっています。すでに自分のテナントのGoogle Workspaceアカウントでも利用が可能になっていました。

図:2.5 Flashが登場しました

画像編集機能がGeminiアプリにも降りてくる

現在のGemini Advancedは例えば、白いバスを青いバスに変えてと指示をすると、おかしな画像を再生成してしまいます。ChatGPTなどではすでに先行して装備されてる画像編集機能が無い為です。この機能は現在、Google AI StudioではGemini 2.0 Flash Preview Image Generationモデルで利用が可能です。

2025年4月30日発表によると、この機能をGemini Advancedにも提供開始というアナウンスがありました。実際にAI Studioで指示してみたところ、きちんと青いバスを編集した結果として生成してくれました。透過PNGなどの出力や切り抜きなども出来るかもしれません。

沖縄行った時に良いバスがあったので写真に取っておいたものを利用して再編集をしてみました。

※ChromeでAI Studio + Google Workspaceアカウントだと何故か生成されず。Safariだと問題なく生成・再編集できた。原因追及の結果、他のアカウントと多重ログインしてると起きるようなので、問題が発生したらGoogleアカウントを一旦全部ログアウトしてから、再度1つのアカウントのみでログインすると良いです。

図:元の画像

図:現在のGeminiアプリだとオカシナ結果に

図:AI Studioでの結果

図:再編集結果の画像

図:昼間の富士山を星空に変えてみた

複数ファイルのアップロードに対応

これまでのGemini Advancedは複数の画像をアップロード出来ず、1つのファイルしかアップロードが出来ませんでした。しかし、2025年5月5日複数のファイルのアップロードが出来るようになっていました。情報元が見つからずサイレントアップデートなのかもしれませんが、Redditでも同様の報告が上がっています。

自分のテナントは使えるようになっていたので、指示を出してみましたが前述の再編集機能はまだでしたが、新たな画像生成は出来ました。

最大10個まで追加することが可能です。

図:複数の画像をアップできました

Gemini LiveがGoogle Workspaceアカウントでも利用可能に

2024年10月日本語対応として公開されたGeminiモバイルアプリの「Gemini Live」。Google AI One Premiumユーザのみに展開されていましたが、2025年5月9日Google Workspaceユーザにも展開が開始されたようです。

Gemini LiveとはGeminiモバイルアプリに対して、リアルタイムで問いかけをし、双方向で会話をする機能。チャットではなくアレクサのように会話でやり取りを行う機能です。議論したり、相談したり、逆に内容に対してフィードバックを貰ったり、カメラの写真や動画共有して話たりと、ちょっとしたインターステラーのTARSみたいなものです。

18歳以上で利用が可能という制約が設けられています。Google Workspace Business Starter以上で利用することが可能です。

使い方なのですが、

  1. Geminiアプリを起動する
  2. 利用するモデルは、2.0 Flashなどを選択。画面右下チャット欄の端にある音声入力の隣のアイコンをクリック
  3. するとGemini Liveが起動して利用する音声の調整ができます。
  4. たとえば、初手でインターステラーのTARSみたく会話してと頼むと、そのような雰囲気で話してくれます。(ユーモアレベルの調整や正直レベル調整なんかが始まります)
  5. あとはそのまま会話を続けるだけです。
  6. 会話内容はすべてチャットの内容として文字起こしされて残ります。

また、Androidの場合は、ホームボタン長押しで同じくGeminiアプリが起動します。同様の手順でLiveに入ることが可能です。

図:Gemini Liveを起動してみた

図:ホームボタン長押し後にここをタップ

図:アプリからの場合でも起動できます

モデルの選択が分離されました

これまで、Geminiアプリの上部にあるモデル選択部分にすべてのモデルが選択肢としてリストアップされていましたが、いつの間にかこのリストにはFlashやProの標準モデルのみとし、Deep Researchと動画作成(veo2)に関しては、チャット入力欄のほうに分離されていました。

もともとここはCanvasなどが表示されていた領域です。ただし、モバイル版のアプリの方は変更されていません

図:標準モデルとソレ以外が分離

Canvasにてクイズ作成機能

2025年5月19日、Gemini AdvancedのCanvas機能がアップデート。コーディングや3Dモデリングデータなど様々なオブジェクトやプログラムを作成できる非常に今熱い機能ですが、ここに新たに「クイズ作成」機能が備わります。

クイズの元になるファイルをアップロードして、プロンプトから「◯◯なクイズを作成して」と入力して実行するだけ。インタラクティブなクイズが作成されます。現在はDeep Research機能とCanvasが直接連携出来るので、流れで作っても面白いかもしれません。

クイズ回答をすると、ガイドしてくれたりスコア表示してくれたり、改善ポイントなどを提示してくれます。Googleの資格関係のデータ(例:Associate Google Workspace Administratorなど)を突っ込んで試験対策を作ってみるなどや、自動車免許の効果測定試験や運転免許試験場の本験対策などでも使えそうです。

もちろん会社の社内研修の最後に、社員に研修内容に基づく仕上げのテストづくりでも使えると思います。類似の事はGoogleフォームのテスト作成機能で出来ますが、あれは自身でクイズから回答まで全部手動で自分で作る必要があるのでなかなか骨が折れるのです。

  1. プロンプト欄でCanvasをクリックしてオンにする
  2. PDFなどのファイルをアップロード
  3. プロンプトでクイズを作ってくれと頼んで実行。
  4. 右上の作成ボタンから「クイズ」をクリックする

自分はNotebookLM用にDeep Researchの資料をPDFで作っていたので流用し、10問程度の確認クイズを作ってくれと頼んでみました。ただしこの状態ではクイズが作成され動きますが、誰かに使ってもらうということは出来ません。そこでCanvasで続きを作ります。

  • この状態のままプロンプトでこのクイズをウェブアプリとして生成を依頼する
  • 今回はGASのウェブアプリとして使うので、index.html, css, JSのファイルはindex.htmlにすべて含めてもらいました
  • 多少動かない等の調整をしつつ自分で一切コードを書かずにクイズアプリ完成しましたでウェブアプリとしてデプロイ
  • このアプリをGoogle SitesにGASのexecのURLを全体に埋め込みをして完成

この流れ作業が出来るのがGeminiのCanvasの良い所。サンプルの埋込ページはこちらになります。

Google Apps Scriptでウェブアプリケーション作成入門【GAS】

図:クイズ作成機能は馬鹿に出来ない

図:作成中の様子

図:完成したクイズ画面

図:そのままコードを作成してみた

インフォグラフィック作成機能

Google I/O 2025で発表されて当日搭載されて展開されていて、2025年5月20日にアナウンスされたばかりの機能です。既にもう利用可能になっています。

この機能はCanvasを使った機能で、Canvasモードでファイルをアップし、内容をまず出力するプロンプトを叩く。その後に右上の作成ボタンから「インフォグラフィック」を選ぶことで、出力内容の情報を元に視覚化するもので、プレゼンテーションのスライドで人間がこれまで行ってきた作業です。

プロンプトで出力時に一定の方向性を持たせてファイルの中身の出力をしておくと、その内容に基づいて見事にきれいな図式化されたものがHTML + CSSで出力してくれます。あとはこのコードをGoogle Sitesなどに埋め込みコードで貼り付ければ、Googleスライドとはまた違った、表現を実現できます。

サンプルで作成したDeep Research内容のテキストデータからインフォグラフィック化したものをGoogle Sitesに貼り付けたものはこちらのページに用意しました。スライドだと枠によってだいぶ表現が制限されますが、HTML+CSSのページレスで生成されるので、かなりリッチな読みものとしてのコンテンツが作れてしまいます。

※ただ印刷向けのCSSになっていないので、PDF化した時にオブジェクトの位置ズレなどが生じるので、プロンプトで微調整が必要です。

図:ドキュメントからインフォグラフィック作成

図:作成されたものをGoogle Sitesに貼り付け

チャット履歴が検索出来るようになりました

アナウンスには出ていないのですが、2025年5月20日にGeminiのチャット履歴が検索できるように、検索窓が追加されました。特に前にやってた続きを作りたいなと思ったときに探すのが大変だったので、これは地味ですがめちゃ重要な機能です。

特にCanvasでのアプリの構築でいい線まで行ったけれど、続きはまたそのうちみたいなときに、履歴が消える前であれば続きから作れるので、ワード検索して探し当てて続行といったことが出来るようになります。

このおかげでいい線まで行っていたけれど見失っていたCanvasのアプリ作成やり取りが見つかって早速助かっています。

図:検索窓が搭載されました

Deep Research機能が強化されました

2025年5月22日、Google I/O 2025で発表された機能のうち、GeminiにおけるDeep Research機能が4つ強化されました。

  1. Gemini 2.5 FlashにてDeep Researchが使えるようになりました(過去のモデルが同時にいくつか整理されました)。ただ、性能的には2.5 Proのほうが上なので、Deep ResearchではProのほうが推奨。
  2. Deep Researchの結果をそのままCanvasに流して、音声概要作成やインフォグラフィック作成へ繋げられます
  3. 自身の持つファイルをアップロードしてのDeep Researchが可能に。公開情報と機密情報を組み合わせたDeep Researchのレポート作成が可能になりました。
  4. インタラクティブ チャート、計画シミュレーター、関連トピックの詳細な調査の提案などの機能が追加されてるようですが、詳細を現在調査中。

上記のうち、一番のポイントになるのは3.の自前のデータも織り交ぜてのDeep Researchレポート作成。自社にしか存在しないデータを組み合わせての資料作成が可能になることで、単なるウェブ情報だけで構成されたレポートとは一味違うものが仕上げられるようになります。

※2025年6月12日、Android版のGeminiアプリでもDeep Researchが使えるようになりました。リサーチ実行中は時間が掛かるのでチャットを抜けても後で完了時に通知が来るようになります。

図:Deep Researchがスマホでも

Veo3がリリースされました

2025年5月26日、Google I/Oで発表されていたうちの1つである「Veo3」による動画生成がリリースされました。Googleのブログにはまだ掲載されていませんが、Google AI Pro(Google One AI Premium契約)ユーザであれば現時点で利用が可能になっているようです。Google Workspaceアカウントの場合は未だリリースされていません。また、Google AI Studioでもまだ登場していません。

こちらの情報によると、Veo3はGemini AI Ultraプラン契約の米国のみで利用可能という話のようなので、

Veo3はこれまでのようなただの映像のみだけでなく、動画に合わせた環境音や鳴き声、人間の音声なども生成されるようになっており、音声生成AIであるLyriaが採用されているのではないかと思われます。同時にImagen4もリリースみたいな話が出ているので、これから一気に更に畳み掛けるようにリリースが続くのではないかと思います。

現在、Veo3を使った動画作成環境である「Flow」が5月21日にリリースされており、こちらの公式サイトでGoogle AI Pro契約者の人は試してみては如何?

※ただ相変わらず、日本語出力がおかしく文字化けがあるようなので、ChatGPTのそれと比較すると・・・

Veo 3で作成した日本庭園と三毛猫の動画 -Impress Watch

Githubからのインポート対応

2025年6月4日、GeminiアプリにおいてGithubのリポジトリのディレクトリをインポートしての問い合わせが可能になりました。主に開発者向けということにはなりますが、Githubにあるデータを元に開発支援という形で連携させることが出来るようになるため、コピペやら別の手段経由で利用していた人にとっては、余計な手間ひまがなくなります。

利用する為には事前にGithubとの接続を行う必要性があります。本機能はGoogle Workspace Business Standard以上で利用することが可能です。

インポート手順は以下の通り。初回は接続要求が出るはずです。

  1. Geminiのチャット欄左下の+ボタンをクリックする
  2. コードをインポートが出てくるのでクリックする
  3. リポジトリのディレクトリのURLを入れて、インポートをクリックする
  4. 接続要求が出るので、接続をクリックする
  5. この状態であとはGeminiで問い合わせ実行をするだけ。

毎回、問い合わせのたびにURLを入れないと行けないというのが手間ですね・・・ココらへんは今後改善していくと思いますが、特定のリポジトリに対してだけ問い合わせが出来るので、今後はコード支援はGithubを使うという形に統一されていくのではないかと思います。

図:リポジトリのURLを入力する

図:Github接続要求は初回のみ

図:コードについて問い合わせしてる様子

時間指定アクションの実行

2025年6月6日Google I/Oで発表されていた事前にスケジューリングされたタスクをGeminiに指示しておくことで、タスクの自動処理を行わせる機能がGeminiに装備されたようです。

スケジュールアクションという設定内で行うことが出来るようで、アレクサにスケジュール設定していた時のように毎朝サマリーを送るであったり、最新情報の収集と要約を行わせたりが出来るとのこと。

Google Workspaceアカウントでも利用できるとのことで、ChatGPTなどでもScheduled Tasksという機能で先行リリースされています(1月14日くらいからリリースされていたようです)。

今現在まだ、このスケジュールアクションという設定自体が日本語環境では見えないですが、今後正式な展開がなされるのではないかと思います。また、これはこれまであったGoogleアシスタントの代わりを務めるためのものではないかと思います。既に公式ドキュメントは用意されています。

Veo3 Fastが追加されました

2025年6月6日、これまでのVeo3動画生成に対して生成速度がより高速で生成してくれるVeo3 Fastというモードが追加されました。公式のプレスリリースが見当たらないのですが、Google AI Proユーザであれば1日3本まで生成が可能のようです。

現在は、Google Workspaceアカウントでは利用することが出来ず、Google One AI Proプラン以上で利用することが可能です。また、Veo3は動画制作環境Flowでも利用することが可能です。

個人利用というよりは完全に法人やプロのクリエイター向けの機能であるので、なかなか一般の人が使うということにはならないかと思いますが、1つの生成AIの進歩であると言えます。

関連リンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)