Gemini for Google Workspaceの実力ってどれだけあるのか?

2024年2月21日、BardからGeminiに変わり、Gemini for Google Workspace(旧Duet AI for Google Workspace)が利用可能に成りサブスクリプションにも登場するようになりました。あれから数ヶ月他の生成AI界隈も劇的進化を遂げている中、Gemini for Google Workspaceどうなのよ?という話も聞こえてくるようになりました。

Gemini Enterpriseを触る機会を得たので、今回他のサービスとの比較も含めて検証し

てみることにしました。本稿ではGCP側のGemini for GoogleCloudについては触れません(守備範囲対象外の為)。故に、Gemini for BigQueryなどの機能は範囲外となります。

Gemini for BigQueryは2024年11月9日より有料化します。

目次

今回利用するツール

Gemini for Google Workspaceは2つのエディションに分かれており、Gemini BusinessとGemini Enterpriseでわかれます。それぞれの利用料金はGoogle Workspaceの管理コンソール上で見てみると、1ユーザあたりBusinessが1582円/月、Enterpriseが3400円/月となかなかの金額。入れるからには元を取れなければ意味がありません。

つまり、エンドユーザがこれを活用して結果を出す必要性があるわけです。まずは14日間無料体験版で試すことも出来るので、テスト導入の検証をしてみるのが良いでしょう。

基本、Google Workspaceの全エディション対応となっていますが、Business StarterのみはGemini Businessしか利用できないようです。

図:Geminiの価格表

基本情報

守備範囲

Gemini for Google Workspaceの現時点での適用範囲は以下の通り。一部の機能はGoogle Workspace Labsにサインアップして参加したり、ベータテスター参加しないと利用出来ません。

  • Gmail
  • Googleドキュメント
  • Googleスプレッドシート
  • Googleスライド
  • Googleドライブ
  • Google Meet
  • Googleフォト
  • Geminiのチャット
  • Googleメッセージ
  • Google Keep
  • Google ToDoリスト
  • Googleフォーム

Geminiのチャットについては、スマートフォンに於いてGeminiアプリを入れることで、Google MessageやGoogle Assistantからも利用が可能になるみたい(自分の端末ではまだ使えない)。

それぞれのサービスに合ったものが機能として用意されているとのこと。

ポイント

各エディションの機能差

Gemini BusinessとEnterpriseのエディションの差は以下のような感じになっています。

項目 Business Enterprise
使用量上限 1ユーザ1ヶ月1000回まで 無制限
Gmail
Document
Slide
Spreadsheet
Drive
Meet
Gemini Chat

Businessは使用量上限が設けられているため、この上限を超えて利用はできません。またスマフォのパケットと違い、回数を持ち越したり他人とシェアもできません。毎月1日に回数がリセットされます。

※また、Gemini for Google Workspaceは利用者が18歳以上でなければ利用が出来ないようです。

※BusinessとEnterpriseはテナント内で併用が出来ません。どちらか一方のみ購入が可能です。よって人によって違うプランを割り当てるということが出来ません。

個人向けの特典

Google Workspaceではなく、Google OneのAIプレミアムプランを契約すると、以下のような特典がついてきます。

  • Google Photoの編集マジック機能
  • 2TBのGoogle Driveのディスク容量がついてくる
  • 通常プレミアムとの差は1600円。

Geminiに対して1600円の価値があるかどうかがポイントになります。通常プレミアムがBusiness Standardと同じくらいの料金ですが、Gemini Businessを加えると2260円加算になります。Enterpriseならば3400円の加算

図:プランの差

学習データとして流用されない

よく話題にあげられているのが「企業のデータを学習データとして利用されるのではないか?」についてですが、Gemini for Google Workspaceは各テナントで閉じた運用となっており、Geminiサービス自体の学習用データとして流用されることはないとのこと。これはGemini Chatについても同様です。トップページのよくある質問にも明文化されています。

個人のgoogleアカウントの場合については学習対象となってるようです。

図:学習に使わない旨の明文化

著作権侵害に対する対応

画像生成AIなどは代表的ですが、生成AIが出力した内容を起因とする著作権侵害に関するトラブルについては、Googleが責任を負う旨の明文化が出されています。自動運転Lv4以上だとメーカーが自動運転の事故の補償をするみたいな仕組みと同じですね。

逆に、出力結果が自身の著作権を侵害してるといった場合に対しても、訴えを起こす相手はGoogleということになります。

利用者はこれにより安心して生成AIを利用できますよということですね。

各種国際基準に準拠

SOCコンプライアンス準拠

2024年8月16日、GoogleはGemini for Google WorkspaceがSOCコンプライアンスに準拠したと発表。SOC1, SOC2, SOC3にぞれぞれ準拠済みで、Geminiチャットだけは年内に対応完了予定とのこと。

SOC(System and Organization Controls)とは、CPUのことではなく米国公認会計士協会、カナダ公認会計士協会により設立された第三者監査機関であり、ここが出している認証制度のこと。SOC1〜SOC3の規格があり、会計というか内部統制に掛かる制度です。

この対応により金融機関での導入や機密性やプライバシーに関して業界標準を満たしたことになります。

ISO 27001、ISO 27701 準拠

2024年9月25日発表のブログではない公式サイトでの発表にて、ISO27001およびISO27701への準拠した旨の内容が公表されました。

ISO27001は情報セキュリティに関する国際基準の1つで、情報資産の保護に関する基準になります。また、ISO27701はプライバシー保護の国際基準の1つで、ISO27001を補完する基準としてペアで存在しています。

Gemini for Google Workspaceの試用

公式サイトの試用というボタンを押してみると、管理コンソールに飛ばされます。しかし、そこには他のサブスクに表示されてるような「無料試用を開始」というボタンが無く、価格表示と購入というボタンしかありません。

試用なのにどういうことだ?ということになるわけですが、なぜかGemini for Google Workspaceの言う試用とは他のサブスクとは異なっており

  • 実際に購入をしなければならない
  • 購入後14日間は「試用期間」としてお試しが出来る
  • 試用だけで終わらせたい場合には、こちらのページにあるように課金開始日よりも前にサブスクをキャンセルを手動で行う必要がある
  • 試用期間を過ぎると自動的に課金が始まってしまう。

試用のキャンセル方法ですが

  1. 管理コンソールにログインする
  2. 左サイドバーのお支払い⇒サブスクリプションを開く
  3. Geminiの項目がいるはずなのでそれをクリックして中に入る
  4. 左側の「その他」をクリックして、サブスクリプションをキャンセルをクリックする
  5. あとは指示にしたがって解約を進める

これで課金される前に試用を終了させることが可能です。

図:試用ボタンは無いのです

図:サブスクのキャンセル方法

日本語化対応状況

2024年10月7日、一部のGoogle Workspaceテナントに於いてGemini for Google Workspaceを導入している場合、日本語化対応が配信されてるとの情報があります。ただし、この機能は現在「アルファ版」という位置づけになっており、デフォルトの状態ではまだ日本語対応版は使えません。

9月中という話でしたが、10月であっても正式リリースではないので要注意。

このアルファ版ですが、管理コンソールより

  1. 左サイドバーの生成AI→Gemini for Google Workspaceを開く
  2. アルファ版機能をオンにして保存する

さて、問題なのはこの機能検証してみましたが、注意事項として

  • Gmailの設定に於いて、 スマート機能とパーソナライズをオンにするおよび他の Google サービスのスマート機能とパーソナライズをオンにする をオンにしなければならない
  • テナント単位でのデプロイではなく、人単位でのデプロイのようで、同一テナント内で別の人が使えるようになっていても、別の人はまだ来ていないということが確認されています。
  • スライドおよびMeetでの画像生成についてはα版でも使えないようだ。英語UIでは使える状況。こちらにもスライドとMeetの記載が無い。

といった要素があります。使えない!!来ていない!!という人は確認してみると良いでしょう。

図:アルファ版をオンにする設定

図:UI言語を英語にしなくて済みました

図:Gmail側で設定変更が必要

図:画像生成はまだ英語UIじゃないと使えない

注意点

2024年5月時点では、モデルとしてはGemini Ultra 1.5Proを利用してるようです。しかしこのモデル、英語に最適化されているため、Gemini Chatなどは旧モデルを使ってる模様。また、Gemini for Google Workspaceは2024年10月まで日本語版がリリースされていませんでした。他の生成AIであるChatGPTやClaude3などは当初よりすでに対応済みということを考えると、かなりの出遅れ感。

※世界に於いて生成AIを業務で活用してるか?という調査ではこの言語の差もあるのかもしれないけれど、11カ国中最下位・・・非常に由々しき事態になっているのも事実(俗に言う茹でガエル)。今から検証導入して対応できるようにしておく準備期間と思っておいたほうが良さそうです。

導入済みでアルファ版適用されていない場合には以下の手順で利用可能になります。

  1. Googleアカウントを開きます。
  2. 左サイドバーの個人情報を開く
  3. 下の方にあるウェブ向けの言語の中の「言語」をクリックする
  4. 優先言語が「日本語」になってるので、鉛筆マークをクリックする
  5. Englishを選択して、United Statesを選択。保存をクリックする

但し、この結果としてGoogleサービスの全てのUIが英語となってしまうので、要注意。もとに戻す場合は上記の手順で日本語に戻せば元通り。

Gemini Chatは元々日本語対応なので普通に使えます。

図:言語を英語にしなければならない

他の生成AI事情

Google Trendsの結果

過去1年間ちょっとの日本および世界でのトレンドを、ChatGPT, Claude, Gemini, Stable Diffusionで調べてみました。ChatGPTがどちらでも圧倒的。世界ではGeminiが若干上げてきてるものの、日本国内ではStable Diffusionにもキーワードレベルでは負けてる感じ。

Gemini for Google WorkspaceにキーワードチェンジするとClaudeにも負けてる状況。Duet AIも入れてみましたがカスリもしない。。。。

国別だと圧倒的に中国からの検索が多い。一部はスペインといったものもあるけれど、日本は全体的に低い。

図:日本国内でのトレンド

図:世界でのトレンド

他の生成AIの進歩

生成AIと言えばおなじみで知名度もバッチリあるOpenAIの「ChatGPT」。また、文章系ではかなりイケてるAnthropicの「Claude」。画像生成AIでは結構しられてるStability AIの「Stable Diffusion」。動画系では新進気鋭のRunwayDream Machineが出てきてる。

ChatGPTはMicrosoftが出資しているため後ろ盾は厚い。AzureにもOpenAI Serviceとして提供しているだけじゃなく、最近はMicrosoft CopilotとしてWindowsに乗せてきたり、Microsoft365用にCopilot for Microsoft365をすでにもう提供してきている。Edgeやbingに対してもCopilot in Bingとしてすでに話題にもなっており、圧倒的に感じます。

自身もGASでこれらChatGPT APIやClaude3 APIを使ってきていくつか温めてる構想がありますが、5月13日にGoogle I/Oに先駆けてOpenAIではGPT-4oをリリース。かなりヤバいとすでにX上でも話題になっています。

Stable DiffusionのAIをGASから呼び出して画像生成をやらせるなんてこともすでにもう始まっており、界隈はこの3つで殆ど話題が埋め尽くされてる感があります。

※ちなみにGPT-4oはすでにもう通常のChatGPTにて利用可能になっています(要ログイン:課金は無しでOK)。スピード感が違うね

※現在、Microsoft CopilotはPower Automate生成などを搭載し、「できる Copilot for Microsoft 365 スタートガイド(特別版)」という電子書籍が無償配布中です。

図:リリース情報量多すぎて追いつけない・・・

Google Apps ScriptでClaude APIを日本語で叩いてみた【GAS】

Google ChatのBotにOpenAIのchatGPTを繋げてみた【GAS】

Geminiの出遅れ感

一方、Gemini for Google Workspaceは正直言って話題になっているとは言い難い。理由は

  1. 日本語対応していない(Copilotはリリース当初から日本語に対応済み:)→2024年10月アルファ版より日本語化されました。
  2. Vertex AIからAPIは使えるけれど事例が少ない
  3. ChatGPTやClaudeでは実現済みの機能が未だに搭載されず(スライド生成が未だに1枚。他社はチャットで複数枚のスライド生成まですでに実現済み)。

自分もBard時代にGASから叩けるようにしてみましたが、まぁ手順が面倒臭い。またGoogleの最近の動きというかコレまでの動きとして非常によろしくない点がいくつもあげられる。以下はその代表的な事例。嘗てのMicrosoftのポジションになっていやしないか?・・・邪悪に染まってきてるのか

  1. AppSheetなどは3年経った現在も日本語化されていない
  2. アプリをGoogle Pixelでしか動かせないよう規制してる。ブランドに囲い込みしたいのか?(ChromOSのApp Streamingなどもその事例の1つ)。ChatGPTアプリはそのようなことは当初より無い。サービス普及を自身で制限してるようにしか見えない。
  3. 一般人が利用する機会がほぼ無いので知名度が広がっていない
  4. 完全に他社に出遅れていて悪いニュースの印象が強すぎる
  5. Googleのこれまで行ってきたサ終癖
  6. 自分たちの広告事業に影響を懸念して、積極的に展開していないような気がする(明らかにアピール弱すぎ)
  7. 現時点でGoogle Workspace Update Blog Japanが2024年4月19日で止まってる(本家は5.10まで更新済み)
  8. Google検索コアアップデート個人ブログを蔑ろにしてる気がする。裾野広げるのは一般ユーザです。
  9. 一方で登場して相当年数経ってるのに装備されないGoogle Sites API。放置ですか・・・
  10. 何かというとリブランドと称して名称変更。リブランドは知名度構築する上では悪手。(Google Workspaceも何度名前変わったことか・・・GeminiもDuet AI登場間もないのに名前変えたし)
  11. Google Talkに始まり、HangoutやらAlloやらDuoやらMeetやらと分裂・統合を繰り返した顛末。お客様の信頼を失いかねません。
  12. GCPでテナントが誤ってに削除されるという事件が起きてしまいました。ファーストサーバの事件を思い出します(会社はもう存在しないようです)。原因はこちらに明記されています。
  13. Googleの検索エンジンに関するSEO内部資料がリークされるという事件が起きています。
  14. また、未公開の動画に関してGoogle社員がアクセスしていて漏洩していたという事件も起きています(ガバナンスどうなってるんでしょうね)。

まず、自分たちは完全に出遅れていてOpenAIなどの背中を追わなければ行けない立場ということがあまり理解できていないのではないか?という点と、この世界の「先行者利益」という鉄のロジックを忘れてしまってるのではないか?という点。生成AIサービスもそれが覇権を握るかどうかは、どれだけ人がついていくかに掛かっています。

また、ここまでAIチャットが広まると当然Google検索の利用頻度が下がり、広告事業に多大な影響が出る。すでにWEB広告市場はレッドオーシャンであり、Microsoftと比較してもGoogleの収入依存度は広告事業に傾倒しすぎてるだけじゃなく、そのせいでGCPやGWS、そして生成AIに関して二の足踏んでる感や足引っ張ってる感が感じられる。

2024年5月12日のニュースによるとAppleはGeminiとChatGPTのどちらを搭載するのか?について、ChatGPT採用に向けて最終調整中とのこと。

図:足元がお留守になっている感

Google Apps ScriptからBard API(Gemini)?で質問してみた【GAS】

生成AI界隈の不安要素

あたかも魔法のステッキやパラダイムシフトの到来と言われる生成AI界隈ですが、いい話ばかりではありません。既にもうここまでの間に複数の不安要素が持ち上がっています。これらを無視してあらゆるものが生成AIによって淘汰されるという話は早計です。他のエントリーで記述したもの含めてまとめました。

  • 2024年7月26日のニュースによるとOpenAIの資金が枯渇しつつあるとのこと。では、Microsoftが買収すれば良いじゃないかとなるわけですが、独禁法の絡みからそう簡単な話にはならないわけです(すでにAzureを割引提供していたり、出資もしていますが)。
  • 資金枯渇の理由は「マネタイズが成功していない」という事。また、現時点では生成AIが金にならないだけじゃなく利用してる組織の生産性向上や利益向上に貢献してるのか?といったら疑問が生じてる
  • 同様のことがStable Diffusionで有名なStability AIでも起きている
  • OpenAI社長が長期休暇、技術リーダーが退職しClaude側へ、といった悪いニュースが続いています。
  • また、続けてOpenAIでは立て続けに主要幹部CTOの退社最高研究責任者と研究担当副社長も退社。
  • 1年前にはCEOであるアルトマンが追放されるといったような出来事のあと電撃復帰といったような不安定さがあります。
  • 生成AIの需要増加に伴って、データセンターの電力消費量が急激に増加二酸化炭素排出も爆増。ただでさえ社会情勢でエネルギー問題が喫緊の課題になっている上に、温暖化で大変な事態になっている中で、これは大きなマイナス要素です。
  • 素の生成AIでは社内情報を生かした自動生成は出来ない。学習をさせなければ意味がないが学習させる担当者もいない。結果、配っても使われないというジレンマに陥っている。
  • 生成AI自身が、生成AIが生成したデータを学習してしまうとどんどん劣化していき崩壊するというお話。つまり、世の中生成AIだらけのデータになると、AIがアホになって使い物にならなくなる根本的欠陥があるという。さて果たして本当にそのような未来が待っているのか?
  • 結構前から指摘されていたことですが、生成AIは機械なのに実は計算が苦手。特に引き算とは相性が悪く、その為何かを加算していって答えに到達する手法は得意でも、何かを差し引いて答えに到達するのを実現するのが難しい(例えば、医薬品のポリファーマシーな考えなど)。
  • ハルシネーションの問題(嘘を付く)がなかなか解消していない。昨日今日の話じゃないものであっても、例えば「国道246号線の旧善波トンネルについて教えて」と聞くと内容の半分以上が嘘です(claudeで検証しました)。嘘を抑える為に「ハルシネーションについては起こさないでください」というプロンプトを追加しなければならないという現状。
  • 前述のハルシネーション問題だけじゃなく、Claude, ChatGPT, Geminiで比較してみると知識検索系は明らかにGeminiが上。テキスト処理はClaudeが上。このように各社の生成AIで得手不得手がかなり差があります。

インフレなどでコスト増が高まれば、IT投資は抑えられる。当然そこから得られる利得よりもコストのほうが上回る。そうなると普及が一気に萎む。しかし、現状生成AI企業のマネタイズがうまく行ってるか?といったら疑問。そう簡単な話じゃないということですね。

図:Claudeのハルシネーションが酷い例

図:ChatGPTはマシだけれど間違いが含まれてる

図:Geminiはかなり正確に情報を返してる

Google WorkspaceとMicrosoft365の機能比較

幻滅期到来

第三次AIブーム(人工音声AI等)や、RPAブーム、さらにはDXブームも。これらが今どうなっているのか?といったら、幻滅期が訪れてすでに大半が終息してる状態。Alexaですら大失敗という結末を迎えています。あれだけ話題にはなってもマネタイズで失敗したものは成功とは言えません。

これらに幻滅期が訪れた理由は実は全部同じような理由。つまり、同じ過ちを繰り返してると言えます。

  • 思っているほど使い道がない。
  • 社内にハンドリングや教育する人材がいない(そしてそんな資金的余裕はない
  • 結局外注任せ。肝心のベンダー自身も、対象製品のノウハウ持っていない上に現場のノウハウもない。その外注もしょぼい
  • 社内データを学習させていないから、ほとんど検索エンジンの代わりしかしていない。
  • 社内データ問題は学習(RAG)させてからであれば回避はし易いが、誰がその学習担当するんだという話。
  • ぶっちゃけチャットだ音声だで操作するより手を動かしたほうが早い
  • チャットでプロンプト文章を考えるのも面倒だし、指示の出し方で大きく振れる現状は使いやすいとは到底言えない。
  • 詠唱呪文覚えるのも面倒だし、一発で出なかった時の調整も面倒
  • 文章書く・適切な指示を出すってなかなかのスキルなんですよ?一般社員にソレ出来ます?
  • 回答が凡庸で刺激もなく尖ってもおらずつまらない最大公約数的なものにとどまってる。ビビッとな発想が生成AIには無い。シュールなものはあるけれど。
  • 結果、だんだん関心が薄くなり、導入しただけで終わってる
  • そもそも最初の導入も会社のトップの鶴の一声で始まっただけで、現場からのボトムアップもなければ、戦略的な活用の発想もない。
  • さらに生成AIは人間の生産性を逆に低下させている指摘も出始めています。

さて、現在の生成AIにも幻滅期がそろそろくるのではないかと思います。その理由は上記と全く同じ。盛り上がってるのはベンダーとSIerと新し物好きのインフルエンサーだけ。致命的なのが今だになぜかどこの会社も「チャットというマニュアル操作による低レベルな手法でユーザにやらせようとしてる」という点。

AT車が進化してMT車が絶滅危惧種になってる昨今に、新製品だからといってMT車出しても売れません。なのに、チャットでプロンプト考えて手で入力しろ?は、無理があるでしょ(チャットbot自体もほとんどが大失敗で終わってるのに)。ユーザはAT車を求めてるので。故に、自分の生成AIの使い方は専ら、APIとして利用しユーザはパラメータだけ入れればいい、あとは作者が調整してあげるというスタイル。

いい加減、何回も幻滅期みたいな真似してると生成AIも同じような結末を招く可能性があります。

いよいよ人間に影響が出てきた件

これまでのAIや生成AIが、映画よろしく未来に最悪の結末を招くといったようなことが言われていますが、「映画の見過ぎ」で済めば良いのですが、映画とは違う形ですでにもう影響は出てきています。ホーキング博士もそうした懸念を残してる。

ターミネーター2のようなAIの機械が人間を襲うというのは、あくまでもAIの招く結末のメタファーであって、現実世界では以下のようなことが起きるであろうと言われています。この世界観はDetroit: Become Humanでも描かれていました。生成AIだけではなく自動化の類のAIも同様に・・・

残念ながらAI各社は資本主義経済よろしく、これらが招く結末に対して何かを保証する立場ではありません。しかし一般消費者が失業しモノを買えなくなった未来を招く為の道具なのでしょうか?少々最近のAI各社の流れは前のめりが過ぎるのでは?というのがよく言われてる懸念点です。

以下その懸念点をまとめてみました。

  • 多くの人間が失業し、政府もそれに対する十分なセーフティネットを用意出来ない(財源がなくなる為)
  • クリエイター分野をAIが担ってしまい、絵師・動画制作・プログラミングといった領域を食ってしまう
  • 単純労働分野もAIが担ってしまい、コールセンター・一般事務職・ドライバー・ごみ収集といった領域を食ってしまう
  • 知識ベースの仕事は需要が消える。コンサル・税理士・会計士・弁護士・・・・弁護士はまだ業として残るとしても他はやっていけるのか?
  • タレントを使ったCMが不要という話題。AIで生成したリアルなタレントで十分であるため、俳優業や映画制作などで人間が不要となってしまう。AIタレントは不祥事や不倫でスポンサーに悪影響とか絶対に出さないですからね・・・人間を使うことがリスクになってる。
  • AI企業に富が一極集中するが政府は法人税で特定企業のみ狙い撃ちは出来ない。また法人税を高くすると国から出ていってしまう恐れ
  • 生成AIを使って人件費削減した企業は、消費者が失業者多数であるため、売上が激減する(自分の首を将来絞める内容に皆が飛びついてる状態)。労働者=消費者です。人を皆が切れば生産したものを購入する人は居なくなります。
  • また仮にも代わりの仕事が生まれたといっても、昨日までスーパーのレジ打ちしていた人が到底そのような高度技能職に就けるとは思えない
  • 結果社会の治安が一気に悪化し、国家全体にも致命的な悪影響が及ぶことになる(そのツケは生成AIで成功した!という人間にも及ます)。
  • 残念ながら産業革命と異なり、生成AIが出たからすぐに他の仕事が出てくるということにはならないです(そもそも産業革命時も次の仕事と言えるものは70年後にようやく変わった)。
  • しかし、他社がやるなら自社もやらないと・・・囚人のジレンマ合成の誤謬といったことが起きる。とにかく人を切る手段として生成AI利用を加速化させる。
  • 人間が自己研鑽することをやめてしまい、多くの人間がベーシックインカムに頼ってただ生きながらえる未来(銀河鉄道999にもこういうシーンがあったなぁ)
  • つまり、人間社会のライフサイクルが崩壊する
  • 最終的に一般市民間を通貨が十分に循環することがなくなり超絶デフレ、そして致命的な少子化を招き、結果海外に収入源を求めることになる。しかしその海外も同じ事を行うので植民地的思想で収入を得られることにはならない。金は天下の回りもの。循環しなくなった時点で資本主義経済は崩壊します。
  • すでにGAFA主導でAIによる雇用喪失に向けてのリスキリング支援団体なんてものまで出てきています。
  • 日本に於いても政府レベルで「ホワイトカラー→ブルーカラーへの人材の異動」を画策していたりします。
  • 米国の俳優業の組合の働きかけもあってカリフォルニア州に於いて、AI俳優に制限を設ける州法が成立しました。今後、自由奔放にAIが利用できるということに対して、あちこちで制限が発生すると思われます。

実際すでに米国では生成AI事業への投資の為に、莫大な人間をレイオフしてるというニュースが飛び込んできました。人間が失職しAIが台頭するということがすでにもう起き始めていると言えます。現時点の生成AIは到底人間の代わりを務められるような次元に到達していませんが、この結果他のサービスがおざなり、アップデートの停滞、新機能の先送りなどが起きるのではないかと懸念しています。

この誰も幸せにならない結末という事をメタファーにした作品が、AIを題材にした映画作品なわけです。

※ちなみに「絵空事。こんな事起きることはない」という人は、日本でもこのうちの一部がAIとは無関係ですが別件で起きてる事実や、世界でも産業革命時に事実として起きていたことは知っておいても損はないと思います。

リスキリングしないと10年後どうなるのか?

日本初!AIタレントを起用したCM第2弾! 伊藤園「お~いお茶 カテキン緑茶」新作TV-CM「食事の脂肪をスルー」篇

結局どういう革命?【ゆっくり解説】イギリス産業革命

9割が知らない産業革命時代の”児童ギャング”【歴史解説】

Amazon AlexaにClaude搭載

かつては音声AIとして覇権を取ったように思われたAmazonのアレクサ。しかし、コロナ禍を空けてみたらすっかり耳にしなくなり、気がつけば2年以上も自分も使っていない。Echo Autoまで購入したのに・・・

しかし、2024年10月より、Amazon出資のAnthropicのClaudeが搭載されるとのこと。詳細な以下のエントリーにてまとめています。これでほぼ生成AI界隈は役者が出揃った感がある。音声AIそのものでは、SiriやGoogle Assistantより性能は良かったので、ここからどう巻き返しをするつもりなのか?が注目。Alexa事業は大赤字だったらしいからね。

Notion AIPerprexityもバックエンドはClaudeらしいので徐々にClaudeが勢力を広げています。

アレクサにClaudeが搭載されるようだ

ハルシネーションはゼロに出来ない

前述の懸念事項にもあった生成AIが嘘を付く「ハルシネーション」。一部のエンジニアが人間が嘘を付くのだからAIが嘘をついても仕方ないというような暴論を吐くシーンがあったりしますが、そもそもAI以前に一般ユーザはコンピュータに対して求めてるのは「正確性」です。よって、このような暴論を口にする時点で幻滅期が来ても仕方のないこと。

しかし、現時点でのAIモデルではこのハルシネーションを完全排除することは出来ないという論文が出ているようです。そもそも訓練で使ってるデータが嘘混じりで何の精査も経ていないデータなのだから、嘘が出てくるのは避けられないのは当然の話しであって、これは「汎用AIの限界」とも言えます。

もともと自分の場合汎用AIなど求めておらず、どちらかというと特定分野に特化したAIのほうが利便性が高いので、Gemini, OpenAIに限らずAI各社は前のめりで先走りすぎてるなぁと感じてる次第。一方でGoogleはこのハルシネーションを低減する為のツールというものを出してきていますが、そもそもGeminiは最近特にこの傾向がありますが「自身は言語モデルなので出来ません」的な回答がちょいちょい遭遇する(他社はきちんと回答出来てる)。

Github Copilotに全員参戦

2024年10月30日、GeminiおよびClaudeGithub Copilotのバックグラウンド選択対象として参戦が決定しました。名前から推察するに、ここはそもそもMicrosoftが買収したGithub。皆がお世話になってるプログラマーの集まる場所。

ClaudeもGeminiもそれぞれでコードの提案機能がそこそこ程をなしてきていることもありますし、自分もGeminiをGeminiを使ったVBA↔︎GASの相互変換を過去に実証しています。噂によればGemini for Google Apps Scriptが出る?なんて話も後述で記述していますが、いよいよプログラミング領域にガッツリAIが入り込んでくるので、使いこなせることが求められます。

※Github自体は2008年誕生のまだまだ若いサービスですが圧倒的なシェアを握っています。それまではGoogle Codeなんてありましたが撤退しています。似たようなものにSourceForgeが嘗ては隆盛を誇っていたものの、とある事件を契機に今ではメジャーに使われる場所ではなくなっています。OSDNなんてのもありましたね。

Geminiを使ってVBAからGoogle Apps Scriptに変換する仕組みを作る【GAS】

生成AIが必要とされる理由

とは言え、現代社会に於いてとりわけ日本では生成AIはむしろ他国よりも積極的に推進していかなければ立ち行かなくなる未来が予約されている現状です。

先日のChromebook C436FAの項目でも記述したことではあるのですが

  • 超少子高齢化で人手不足はこれからも悪化する一方。
  • 雇用できないのだから当然変わりになるものが必要となる。
  • 自分たちの組織とりわけ情シスメンバーの維持ができなくなっていく。
  • Microsoftのコストはガンガン鰻登り。円安やインフレも相まってITコストが経営を圧迫していく。

これまでもWindows95降臨やスマフォ時代の幕開け、コロナによるリモートワーク時代到来といったパラダイムシフトが起きて世界が変わりました。生成AIは経った1年でここまで進化しすでにもう特定職種の人を駆逐し始めています。無視を決め込んでも周りは変わっていき、自分だけが取り残されて最終的には駆逐される運命が待っています。企業も人も。(DX推進阻害要因の事務職担当者などは先行して駆逐され始めています。スマフォ1つで日本の家電業界がどれだけ淘汰されたことか。無視を決め込むとこうなります)。

ということなので、今の時点で取り組みを始め、まずはデスクワークからということであるならば研究開始にはいい頃合いではないかと思います。セミナーなどもすでに開催が始まっているので、企業内担当者は情報収集と研究を今直ぐ開始しましょう。

ASUS Chromebook flip C436FAを業務で使ってみるテスト

2024年イベントでの発表

Google I/O 2024

2024年5月15日 深夜2:00、Google I/O 2024が発表されて、Gemini for Google Workspaceに関してのいくつかの発表がありました。ここではGoogle Workspaceに関連性のあるものをピックアップしてみました。

関連性のある発表項目

多数の発表があったので、Google I/Oの中でGoogle Workspace関連となると以下の項目になります。I/Oは開発者向けのイベントですので製品発表会というスタンスではなく、一般ユーザ向けではないため難しい面も多々ありますが、今後リリースされてくる機能にも大いに関係があるので、1度目を通しておくと良いでしょう。関連動画だけプレイリストでまとめました。

※まだ開発中のようですが、Google ChatやGmailに於いてGeminiがBotのように動作してくれる「AI Teammate」も発表だけはされています。これがGemini for Google Workspaceに統合されるらしいです。

How to automate Google Workspace tasks with Gemini

図:関連動画だけプレイリストでまとめてみた

基調講演
Google Keynote (Google I/O ‘24)

Developer Keynote (Google I/O '24)

セッション別動画
Unlock the Power of Generative AI in Google Workspace: Best Practices for Effective Prompting

Cloud Next Tokyo '24

Cloud Next Tokyo '24では、Gemini for Google Workspaceの日本語化対応が発表されました(拡張機能β版やGemsの発表も)。Google I/Oと違ってお祭り的なイベントであるので、方向性が違いますがこちらのイベントは企業のユースケースであったり、技術の活用事例といったようなより現場に近いセッションが聞けたり、Googleの担当者と直接会話できたりと、1度は行ってみるとよいのではないかと思います。

※日本語化対応発表は55:20からになっています。

Google Cloud Next Tokyo ’24

DAY 1 基調講演

DAY 2 基調講演

Gemini for Google Workspaceの検証

現時点では、Google FormやGoogle Sitesに関しては未対応のようです。

Gemini Chat

Google Workspaceの標準アプリの1つとして追加

2024年9月25日公式サイトでの発表の1つとして、Geminiチャット(Gemini Advanced)についてはGemini for Google Workspaceのアドオンが無くともGoogle Workspaceの標準アプリとして搭載し無償化するという内容が発表されました。

Google WorkspaceユーザはGeminiチャットはアドオンなしで無償でアクセス可能で、また同時にこのチャット上でのデータは以前と同様にトレーニングには使われずデータも保護されるとのこと。

Gemini for Google Workspaceは依然として有償のアドオンが必要なので別途導入が必要です。

図:Geminiチャットの管理画面は別です

現在はオープンベータ

GeminiのChat自体日本語で利用可能です。前述の通り、GWSアカウントであるならば学習のネタにされることも無いので安心して利用は可能です。5/14時点ではGemini Ultra 1.0が採用されていますが、実はすでに1.5 Proの機能を試せるようになっています(Google AI Studioという画面になりますが)。但し、Gemini Chatと違いドライブの中身は調べられないようです。

Welcome to Gemini eraというサイトから様々な情報を発信しています。

しかし2024年7月時点まだオープンベータの状態です。管理者が機能をオンにしないと利用できません個人のアカウントでは可能です。設定場所は以下の通り。

  1. 管理コンソールにログインする
  2. 左サイドバーからアプリ⇒Google Workspace⇒Geminiを開く
  3. Workspace 拡張機能 (BETA)を開く
  4. 組織部門を選択する
  5. この中の「Gemini内のWorkspace拡張機能へのアクセスをユーザに許可する」のチェックをオンにする
  6. 保存をクリックして適用する

これで、Gemini Chat上でGWSであっても拡張機能を利用することが可能になります。左下の設定⇒拡張機能に入って利用開始可能です。

個人アカウントの場合、チャット入力欄に@を入れると対象サービスを選択できて、そのままドライブの中の資料を検索してまとめて出すといったようなことができるようになっています。

2024年8月27日、ライセンス所有者はGeminiチャット上にファイルをローカルからアップロードしての各種AIチャット機能が利用可能になりました。DOCXやXLSX形式などのオフィスファイルやPDFなどなど。

図:個人アカウントだと利用可能

図:@で対象サービスを調べられる

図:Gemini Ultra 1.5が使えるようになる

図:設定箇所

図:スマート機能をオンにしないといけない

図:実際にGmailの要約をさせてみた

使用を開始する

前述の管理コンソールでオンにしただけでは使えません。各ユーザにて以下の作業を行います。メールを使う場合には別の作業もあります。

  1. Gemini Chatを開く
  2. 右下の設定⇒拡張機能をクリックする
  3. Google Workspaceの項目が出てくるのでスイッチをオンにする
  4. 接続しますか?と聞いてくるので、「接続」をクリックする

これで利用開始することが可能です。

また、Gmailを探索させる場合の注意点ですが、スマート機能とパーソナライズがオンになっていないと使えないようです。

  1. Gmailを開く
  2. 右上の⚙の設定を開く
  3. 全ての設定を表示をクリック
  4. 全般タブの下の方にある「スマート機能とパーソナライズ」と「の Google サービスのスマート機能とパーソナライズ」のチェックをオンにする
  5. 一番下にある変更を保存するをクリック

この状態でチャットで聞く必要があります。@マークを入力すれば開始することが可能です。

図:スイッチをオンにする

図:接続しないと開始出来ません

GASのコード生成をさせてみた

試しにGASに於いて、グループアドレスをFromに指定して、他者にメールを送信するコードを生成依頼してみました。

実際に検証してみましたが、全く動かない上にオカシナ文言が書かれてるので、GASのコードを生成出来るといっても、やはり知識がない状態で使うには危ういなと。確かにFrom偽装は出来ないのですが、権限の委任でもってGmailAppにて送信は出来るのです。

生成出来るとは言え、あくまでも単発のよくある事例の関数が書けるだけで、到底全体のアプリケーション設計まで考慮して作れるレベルには至っていない感じです。自分のところのサービスなのに・・・・

図:ChatGPTはまずまず。説明が若干オカシイけど

図:Claudeは最高の回答でした。

図:Geminiはなんか退化していますね

グループアドレスのメアドでGoogle Apps Scriptからメールを送る手法【GAS】

デジタル校正を依頼してみた

Claude3の時にも短い短文ですが、いくつかの誤字脱字などを含めた文章をなげて文章校正をしてもらいました。

この投稿結果に対して、Claude3は非常に的確に返してきましたが、Geminiの場合は以下のような結果になりました。

  • 文章校正はClaude3と大差はない。ただClaude3のほうは終りの「ら抜き表現」を指摘していたので、Claude3に軍配が上がる
  • Claude3は的確に結果だけを箇条書きで返してくれましたが、Geminiは余計なことに修正文を付けて返してきました。プログラムからの利用を想定してるからこその命令だったのですが、理解出来なかったようです。

デジタル校正能力は確かにあるとは思います。しかし人間の命令を的確に理解する力が弱い。命令文だけを投稿するとなぜか英語に翻訳して命令文を返してきました。

実は同じ文言でChatGPTのGPT-4oにも投げていますが、こっちは期待したのですが修正した文全体を箇条書きでピックアップしてくるというオカシナ挙動を示しました。現時点で個人的感想としてはこの手の文章処理はやはりClaude3が最強では?

図:デジタル校正についてはClaude3に軍配

観光スポットのランダム生成

AppSheetで作ったドライブアプリにAI連携加えて、出発地と目的地の間にオススメスポットをランダムに入れる機能を考案中。 GeminiとChatGPTで試してみた。 このランダム性については両者大きく差が出ました。

  • ChatGPTの場合 適切な解答形式と毎回異なるポイントを入れて返してくれました。Good👍。ただし、緯度経度情報の精度が悪い。

  • Claudeでも試してみましたが、最も理想的な回答がきちんと毎回違うスポット経由で出してくれました😀。 やっぱり、Claude好きだなぁ。デジタル校正でもバッチリだったし。

  • 一方Geminiは使い物になりませんでした。

※ちなみにClaude3.5 Sonnetはマップコードは未対応だが、ChatGPTはマップコードで返せるのがわかった。

※ClaudeもChatGPTも返答できましたが、緯度経度情報がオカシイ(実際にマップしてみると見当違いの場所に飛ぶ)。ので、ここはGoogle Maps APIのリバースジオコーディングで住所に変換のほうが結果的には一番望む結果を得られています。

AppSheetで他のアプリと横連携させる【GAS】

図:ChatGPTはまずまず


図:Claudeは緯度経度情報が詳細

図:Geminiはダメダメでした

Gems機能で独自Chatを作成機能

ChatGPTのGPTsのような、ノーコードで作れるのか?など詳細は不明ですが、Gemini ChatにGemsという独自Chat作成機能が追加されるようです。ユーザが色々プロンプトで頭悩ませなくても、Gemsを追加することで独自最適化されたチャットを利用できるようになるのではないかと思われます。

GPTsは収益化や外部のREST API対応など非常に多彩に実現していってるのですが、果たしてどういった機能なのか?近日公開予定の模様。

Gmail

メールの文章を書くのに一番パワーを要するのが書き出し。どうしようかと悩み何時間も過ぎる。というのをサポートするのがGeminiのHelp me write

ということで使ってみましたが、もちろん英語しか使えない(キーワードじゃなく自然言語でリクエストは出来る)。文章としては友人・旅行・岐阜を元に頼んでみましたが大丈夫かこれ?と思いましたが、実際に生成されたワードが以下の通り。

※2024年8月21日、自分が作った下書きをフォーマルな文章に変換するポリッシュという機能が増強されました。また、Android向けにスワイプ等によるショートカット操作でHelp me writeが使えるようになりました。

Google翻訳で翻訳させたらあまりにもラフというかフランク過ぎたので、Gemini Chatで翻訳してもらいました。友人に岐阜への旅行のお誘いについてという文章としてはよく出来てるとは思います。自分は候補をあげてどこ行きたい?と聞きたかったのに

返信に対しては何かアクションできるのか?ということで、上記の文章を別アカウントから送って返信というアクションをしてみました。この時返信をクリックして、help me writeで「Give the sender some suggestions for meetings」としてcreateをクリックしたら、受信内容を加味した状態で、リプライ内容を生成してくれました。

ここで個人的に欲しかったのが、打ち合わせ日程の候補を自分のカレンダーあたりから取ってきてくれることが出来たらいいなと思う点。行ったり来たりがかったるいので。

また、デフォルトでの解答が固い、固すぎる。修学旅行の実行委員かと・・・。こういうことがあるので修正を指定するわけですね。

さらに、gifu(岐阜)はオッケーでも、norikura(乗鞍)はこの言語はサポートしていないなどと返ってきました。

別の角度で白川郷、乗鞍高原、下呂温泉でリクエストしたら白川郷以外はスルーされました。これは頂けません。自分乗鞍高原の温泉派なので。深さが全然足りない!!メール返信時の下に勝手に出てくるワード候補よりはマシってだけで現時点では正直、力不足が否めません。

図:help me writeという機能

図:出力してみた

ドキュメント

Gmailにつづいてドキュメントではどうか?こちらもHelp me writeという機能のようです。日本の戦争の歴史に関するレポートを生成したいとリクエストを投げてみたところ、以下のような内容が返ってきました。

こちらも結果をGemini Chatに投げて翻訳をさせています。

なかなか短くよく纏まっていると思います。ここからこれらを章割りして書き始めるには良い構成ではあると思います。

ちょっと意地悪というか、よりディープな内容として日本の西南戦争(Satsuma Rebellion)に関する同様のレポートも依頼してみました。

こちらもよく纏まっていると思います。しかし、同じスタイルで戊辰戦争についてリクエストを投げてみたところ、会津藩の記述は無し。追加のワードでカッチリ指示を出せば戊辰戦争についても会津藩の記述について知ることができました。

つまり、help me writeと言っても、利用者による適切な指示を出す能力が求められるということですね。

但し、自分がドキュメントに求めてるAIな機能というのは、作成した文章を英文翻訳してくれるとか、作成した文章をデジタル校正してくれるとか一歩踏み込んだものであって、すでに現場ではClaude3などを使って実現できてる事なんですよね・・・メールと違って求められてるものに至っていない感じ。

既存の文章を範囲指定して、左側のキラキラ光るペンのボタンをクリックすると、色々再指定が出来ます。よりフォーマルにしたりフランクにしたり。

図:こちらもhelp me write

図:ドキュメントとは相性が良いかも

図:特定範囲だけちょっと書き直し依頼

スプレッドシート

GoogleスプレッドシートはGASでも最もよく利用されるものなので、どんなことが出来るのか?と期待してはいるのですが、現時点では「help me orgnize」とスマートフィルで使える、この2種類のみ。GPT-4oで発表されたような画像のOCRで領収書の表形式部分を抜き出すみたいな事は出来ないようです。

このHelp me Orgnizeなのですが、例えば「I want to create a table to manage the work and production of plant cultivation.」みたいに文言をいれると表が自動生成されるような感じのアシスタントをしてくれる。機能はInsert => Help me organizeにあるのでクリックするとサイドバーが開く。

使ってみた印象ですが、まぁ表を生成してくれるのはわかるのだけれど、全然イメージとは違うものが作られてる感。指示に悩むくらいならテンプレートから引っ張ってきたほうが早いし、例えば工数管理だのプロジェクト管理とかの表といっても全然機能足りないので、自分は多分使わない。

スマートフィルは正直これ、今までの延長でしか無いのでAIどうこうを全く感じない。

ということで、かなり期待外れでした。入力欄に入れてヒアリングもせずに一発でジェネレートしようとしてるのが非常に気になる。このあたりが足りない点なんだろうなと思う次第。また、こういう類は言語化して指示出すのって難しいのよ。なので普通の人が高度な人が使ってる表生成は指示出してどうこうってのはちょっとね・・・・

図:指示を入力する画面

図:作成された生産管理表

スライド

Googleスライドに搭載されているGeminiは、「Create image with Gemini」と呼ばれる画像生成AI。個人的には画像よりも自分の指示に従って、商品説明するスライド群を自動生成のが有り難いんですが・・・ただ、スライドに合うような商用利用可能でフリーなイメージにピッタリの素材って検索で見つけるのって結構な手間なんですよね(いらすと屋さんくらいしかない)。なので、この機能はそうした時間の削減にはつながるのではないでしょうか?

右上の小さな画像のアイコンをクリックするとサイドバーが開かれて、指示を入れると画像生成してくれるというもの。割とこの発想はStable Diffusionの頃から誰もが思いつくもの。

ワードを入力、スタイルを選択(Cyberpunkとかある)、そしてCreateをクリックするだけ。今回入力したワードは「荒廃した街の中に小さな植物の芽が芽吹いて、未来への希望の一歩となるようなイメージ」という絵面でのCyberpunkスタイル。

結構生成スピードが早く、割と自分のイメージにピッタリの画像が生成されました。同じ条件でmacOSのDiffusionBeeで作ってもらいましたが、こちらは生成まで結構な時間が掛かる。おまけに奇っ怪な植物が登場してしまった。画像生成に関しては割と良いのではないしょうか?ちなみに、removing backgroundを画像に対して実行したら植物だけきっちり切り抜いてくれました。

現在のスライドはこれで動画を作れる機能があるので、Youtube動画のインサート素材などで使ってみるといったこともできそうな気がします。ただ、まだ細かい指示も出せないのと、既存の画像を加えてのリメイクなどが出来ないのでこれからに期待といった感じです。

※ちなみにChatGPTは要約した上でスライド生成までやってくれます。3Dモデリングデータの生成もできるようで。でもどうやって指示出してるんだろう・・・

図:他にも色々な目的で使えそうではある

図:DiffusionBeeでは奇妙な植物が・・・

図:植物だけを切り抜いて見た

図:桜島は生成してくれなかった

Meet

Google Meetに対するGeminiはやや機能が多い。

背景画像生成

背景画像をアップロードや選ぶのではなくその場で生成することが可能です。ちなみにこの機能はChromebook Plusでも利用が可能で、Chromebook Plusの場合はMeetだけじゃなくデスクトップの壁紙の生成でも利用が可能になるようです。

  1. Meetの下の「︙」をクリックする
  2. Apply Visual Effectsをクリックする
  3. Generate a Backgroudのボタンをクリック
  4. キーワードを入れて、Create other Samplesをクリック。
  5. 生成された候補をクリックして適用する。

気分に合わせて、背景を選べるのは遊び心ある良い機能だと思います。

図:背景画像を生成するボタン

図:ジャングルの中の机と椅子で指定してみた

音質と画質のエフェクト

部屋が暗いであったり、音質がなんかいまいち悪いという環境下の場合、Geminiの機能を利用してエフェクトを掛けることで向上させることが可能になるようです。Studio Look、Studio LightingやStudio Soundと呼ばれています。ただし、Studio Lightingについては特定のプロセッサである必要がある様子(Apple M1は対応してる)

この機能のうちStudio LookとStudio Lightingが手動で調整しますが、Studio Soundはノイズキャンセリングオンで自動で有効化されるようです。

LookとLightingは背景画像生成時のEffectsにてAppearenceのタブで設定が可能です。

図:エフェクトもAIで調整する時代

リアルタイム翻訳

もともとMeetにはリアルタイム翻訳機能があったわけなのですが、Gemini Enterpriseを利用してる場合にはこのリアルタイム翻訳機能に置き換わるようです。但し、英語⇒日本語は可能でも、日本語⇒英語は出来ない様子。双方向翻訳可能なのは、フランス・ドイツ・ポルトガル・スペインの4つのみ。

2025年1月25日より、Gemini for Google Workspaceライセンス購入者のみが利用できる機能として変更されています。使い方に関するドキュメントはこちらにありますが、日本の場合利用してるユーザが少ないと思われるので現状では影響は軽微と思われます。

会議内容の要約

概要

Duet AI時代より継続してるサービスで3つで構成されています。これらはまだリリースされていない可能性があります。

  • attend for me - 自分の代わりに出席し、伝えたい内容を録画しておく機能
  • summary so far - 会議内容を自動でそれまでの要約を行い表示する機能。遅れて会議に参加した人が追いつくための機能です。
  • take notes for me - 自分の代わりに議事録を取ってくれてアクションや動画の切り抜きを記録してくれる。

といった会議アプリでもってよく利用されそうな補助機能です。

AI議事録機能

2024年8月13日より、Gemini for Google Workspace購入者のメリットとして、MeetにAIメモ取り機能が搭載されます。取ったメモはドライブに保存されるようになります。

利用できるようにするためには、管理コンソールから

  1. 左サイドバーよりアプリ⇒Google Workspaceを開く
  2. Google Meetを開き、Gemini設定を開く
  3. チェックボックスにチェックを入れて保存する。前述にあった「take notes for me」に該当する機能だと思われます。

同様のMeetのアドオンとしてはread.aiのAI-Enhanced Transcripts & Summariesというサービスがあり、こちらは日本語がすでに使えます。ちょっと使ってみましたが、日本語で記録はしてくれるけれど、精度はそこそこといった感じで感動するようなレベルではなかった。

図:管理コンソールの設定箇所

ハウリング防止機能

通常会議室で多数の人が集まってノートPCを開いて会議を実行すると起きるのが「ハウリング」。誰もが一度は経験があるでしょう。故に通常はテレカン用のUSBタイプのスピーカーとマイクを使って参加し、他の人はミュートにしておくというやり方が通常です。

しかし、Google Meet + Gemini for Google Workspaceではこれを検知して、アダプティブオーディオという機能により、不快なハウリングを防止できるようになったようです。また同じ会議室参加の人はグルーピングされて会議メモなども1つに結合されるようです。

アダプティブオーディオはデフォルトでオンにされますが、設定=>音声=>アダプティブオーディオからオフにすることも出来る模様。なお、Gemini Businessでも利用可能なので、Geminiをライセンスとして導入してるアカウントであれば即時に使えるようです。5/22から段階的リリースになってるので今まだ対応していないアカウントでもそのうち使えるようになるでしょう。

図:MeetのGeminiの新機能

電子透かしを入れる機能

これもGemini関係あるの?という機能ですが、2024年10月3日よりGemini for Google Workspace利用者がMeetでのプレゼンの様子の動画キャプチャに対して電子透かしを入れることでコンテンツを保護するという機能が追加されました。

ただしこの機能はGemini Enterprise等でなければ利用することができません。

フォト

Gemini for Google Workspaceを導入してるユーザ向けのGoogleフォトの機能として「Magic Editor」が提供されています。これらはChromebook Plusでも利用が可能になった模様。編集マジックに関してはChromebook Plusのみの機能ということでPRされています。

写真に対して被写体のサイズや位置、証明などを変更することが出来る。一部のPixelユーザだけが使えていた消しゴムマジックも一般のAndroidユーザが使えるようになっていますが、これに続く編集AI機能になります。

ドライブ

機密データ自動ラベリング

こちらの機能はユーザ向けというわけじゃなく、Google Workspaceテナント管理者向けの機能になります。Driveを探索して色々やってくれるのはGemini Chatの方になるので注意。

Google Driveのファイル類に対して、機密データの自動ラベリングをする機能がGemini Enterpriseにて提供されています(DLP機能の1つ)。Cloud Next '24にて発表された機能の1つですね。また利用できるのがBusiness Standard以上となります。自動ラベルの機能の説明についてはこちらにドキュメントが公開されています。

但しトレーニングをしてあげないと行けないようなので、他のGeminiのサービスとは異なり、すぐにでも使える便利なAIというわけにはいかないようです。

PDFに対してGemini

2024年7月30日、これまで無かったPDFを開いた場合に、対象のPDFに対してGeminiで問い合わせのサイドバー機能が搭載されたようです。事前にスマート機能とパーソナライゼーションをオンにしておく必要があるようです(ユーザ側から出来ますし、管理者側から一括でも出来ます)。公式操作ドキュメントはこちらになります。

まだ自分の環境には来ていませんが、ブログによると

  • 画像をスキャンしたPDFでも行けるようだ
  • 複雑な表組みがあるPDFでも行けるようだ
  • 要約、質問、PDFを元にメールやドキュメント作成、他のファイルと結合といったことが可能になるようだ。
  • PDFダブルクリックして、上部のGeminiアイコンをクリックするだけで使える
  • 個人でもGoogle One AI プレミアムを購入してると使える。

図:PDFでGeminiの様子

図:パーソナライズをオンにする

Google DriveのPDFでGeminiサイドバーが使えるようになった

Geminiアプリ

概要

自分のスマフォではGoogle Geminiのアプリが使えずの状態(Android13の機種なのに)だったのですが、ようやく6月末から利用可能に。GeminiのアプリはPCのブラウザから使うGemini Chatと違ってDrive連携であったりとかは出来ないようです。

MapsやらTravelやらは連携して動くようですが、だからといってえきねっとに繋いですぐ購入みたいなことにもならないようで。これまでのウェブの検索のリソースが全然生かされてない感じ。

Googleアシスタントを置き換えてしまうので、かといってアシスタントに出来ることが出来るのか?といったら出来なかったりするので上位互換でもないという状態。

図:利用者制限してる場合ですかね?

Gemini Live

ChatGPTでは既に装備済みの機能ですが、Gemini LiveというGeminiとリアルタイムで会話を行うための機能が装備されたようです。公式ページでの発表はこちらになります

Google Assistantを置き換えるとなると当然このくらいの装備は必要になるでしょうが、X上で動画が公開されています。ハンズフリーで使えるそうですが、Keepへメモ登録機能なども使える模様。

また、この機能はAndroidユーザ全員に無償で提供されるようで、現在は英語版のみ。日本語版対応の予定などは現在未定の状態です。

Gemini in Googleメッセージ

どうやら一部の人にはすでにAndroidのGoogleメッセージに於いてRCSがオンになってる等の条件を満たしてるスマホの場合には、Gemini in Googleメッセージが来てるようです。公式ドキュメントについてはこちら

事前に

  • RCSメッセージをオンにしないと利用が出来ない
  • おなじく設定欄の中のGemini in メッセージでオンになっていないと使えない。
  • 現時点ではGoogle Workspaceアカウントでは利用が出来ないようです。
  • 2024年9月6日時点では、ベータテスターに参加していないと使えないみたい。Google Play上から参加可能。

対応してる場合には、メッセージ右下の「チャットを開始」⇒ Geminiで直接Googleメッセージアプリ上でGemini Chatが出来るようになるみたいです。言語としては日本語は対応済みの模様

図:Gemini in メッセージを有効化

図:RCSメッセージを有効化

図:ベータテスター参加が必要

各種レポート

アクティビティ監査ログ

Gemini for Google Workspace用の管理コンソールに於けるアクティビティ監査ログ2024年6月10日より装備されました。コンテンツへのアクセスのログがここで閲覧することが可能になっています。

Business, Enterprise, Educationともに対応しておりデフォルトで使用可能。

ドライブの監査ログの一部として装備されてるようだ。

使用状況レポート

管理コンソール上のGeminiレポートより、ユーザがどれくらいGemini for Google Workspaceを活用しているのか?といったレポートを得ることが可能になりました。

また、2024年9月9日にはユーザレベルでの利用状況レポート機能も搭載。情報をエクスポートして分析もできるようになった模様です。ただ、ユーザがどんなワードで生成AIを使ってるのかどうか?は取得できるのかは不明・・・

図:ユーザのGemini活用レポート

サイドパネルにGemini 1.5 Proが統合

2024年6月25日、Gemini Business / Enterprise利用者のGoogle Workspace上に於いて、Googleドキュメント/スプレッドシート/スライド/ドライブのサイドパネルにGemini 1.5 Proが統合されて利用できるようになったようです。Gemini for Google Workspaceとはまた別に装備されてるものになりますが、Google Workspaceアカウントの場合はGeminiのライセンスがなければ利用できません

メールスレッド要約やドライブのファイルに対する質問などがダイレクトに出来るだけでなく、Android/iOS上のアプリでも利用出来るようになっているため、アドオンとして実装されてるようです。

7月8日より順次展開(早期リリースでは6月24日から展開中)されるようで、公式ブログで発表されています。

通常のGoogleアカウントの場合はライセンスなくとも既に利用可能な状態になっていますが、前述のように「UIの言語を英語に変更」しなければGeminiのアイコンがアプリの上に出てきませんので使えません。

個人で利用する場合には以下の作業が必要になります。

  • 各Geminiサイドパネルの機能はこちらから確認することが可能です。
  • Gmail, Sheet, Docs, Slides, Meet, Drives, Vidsに対して利用が可能です。

図:Geminiサイドパネルが使える

図:上部にGeminiアイコンが出てくる

図:Geminiアイコンも出てくる

Google Chat

2024年10月21日、Gemini for Google Workspaceライセンス購入者対象に、新たにGoogle Chatの要約機能が提供開始になりました。それぞれのスレッドに大してサマリーといったボタンが表示されるようで、クリックするとスレッド内の会話が要約されて表示されるという仕組みになっています。

summary

図:サマリー表示する機能が搭載

Google Vids

2024年7月1日以前よりアナウンスがあったGoogleの動画編集アプリであるGoogle Vidsがテスト運用開始になりました。現在はGoogle Workspaceアカウントからは利用できませんが、通常のGoogleアカウントからであればすぐに試すことが可能です。

但し利用する為には以下の作業が必要です。

  • Google Workspace Labsにサインアップが必要です。
  • アプリ一覧には出てこないので、こちらのURLから直接入って利用する必要があります。

こちらもGeminiを活用した動画作成ツールになっていて、Help me createと呼ばれてるようです。自分も普段はAdobe Premiere ElementやiMovieを使って動画編集していますが、ChromebookやWindows11などでは既に話題になってたClipchampのようなウェブサービスとして動画編集できるサービスになると思いますが実力のほどや如何に?

作成をするとGoogle Drive上ではファイルとして表示されることになります。

Geminiに関してはGoogle Slide同様にまだ画像の生成くらいしか機能が無いようです。話題になってるLuma Dream Machineのように写真から動画を生成するなどの機能が望まれます。

※Vids自体は2024年12月末までにGoogle Workspaceのコアサービスとして追加され、Geminiライセンスがなくても利用が可能になる予定です。

図:どれくらい使えるのだろうか?

図:ドライブ上でもファイルとして確認可能

図:Geminiが使える

動画:Dream Machineの事例

Google KeepやTodoリストにも来るかも?

まだ現時点で公式に何も発表されているわけではないのですが、Google KeepやToDoリストでもGemini for Google Workspaceが利用できるようになるらしいです。公式サイトにもページだけは確認

もともとの出典は9to5Googleのエントリー記事のようで、Pixel9などの一部のデバイスで利用可能になるみたいですが、英語にしか対応していないとのこと。とりあえず、Google Keepは見捨てられて居なかったということだけでも価値のあるニュースかもしれない。

Android端末でのKeepではHelp me create a listが英語だけ対応ですが使えるようになってる模様です。

2024年10月21日発表に於いて、現時点でGemini for Google Workspaceのターゲットに入っていなかったKeep, Calendar, ToDoが仲間入りとなった発表がありました。Geminiとの対話でカレンダーイベントを登録・検索したり、タスク登録したり、対話内容をKeepに保存するといった一連の作業が行えるようになった模様です。

Google Form

Google Workspace Labsレベルですが、Googleフォームに対してもGemini for Google Workspaceが登場したようです。こちらに公式ドキュメントがあります。LabsレベルなのでVids同様、Labsで参加していないと使えないものになります。

現在は英語などの一部でしか利用が出来ませんので日本語での問い合わせには対応していません。

help me create form

図:フォームに作成を依頼してる様子

Gemini in Classroom

詳細な内容は出ていませんが発表だけされた「Google Classroom向けGeminiの新機能」が提供されるようです。教育機関向けとなると思いますが、AIの力を利用して、生徒のアクティビティに基づいての検証やコンテンツ制作?の補助をしてくれる模様。

また、10代の学生に対して無償でGeminiを利用可能になるようで、学校の負担が減ります。

※また、2024年8月30日にEducation向けGeminiに対して追加のデータ保護が無償で利用可能になり、より安全に学校で利用が可能になっています。

Gemini in AppSheet

2024年7月26日、これまで個人のGoogleアカウントでライセンス無しでExperimentalとして利用出来ていたGemini in AppSheetが、Google Workspaceアカウントでも「AppSheet Enterprise Plus」を購入してるライセンスを持っているユーザに展開されました。但しこの機能はGemini for Google Workspaceと言うより、AppSheet Enterprise Plusの特典となっているようだ。故にGemini for Google Workspaceが無くても利用可能

現時点ではUIが英語のままですが、Create ⇒ App ⇒ Start with Geminiで専用の作成チャットを開くことが可能です。UIは英語のままなのですが日本語でリクエストが通ります

実際に買い物と入れて作ってみた所、確かに生成されました。ただ、リストの子供向けのおもちゃの項目を開いてみると、サブテーブルの中に生成されてるのがGarlicなどが入っており、きちんと細かく指定をしないといけないみたいです。

図:利用規約とチェックを入れてContinue

図:専用のチャット欄から作る

図:自動生成されたアプリ

Google Chrome

Google ChromeにもGeminiの機能が搭載されました。Edge Copilotに影響を受けて装備されたものと思われます。こちらの機能に関しては一般公開されてる機能なので、Gemini for Google Workspaceのようにライセンスが必要といったことが無いようです。

こちらのページに本アップデートの内容の一部が掲載されています。

アドレスバーから直接Gemini

アドレスバーに「@gemini」と入力してChat with Geminiを選択すると、アドレスバーから直接Geminiに対して問い合わせが出来るようになっています。但し、現在はブラウジング内容にはアクセス出来ないので、見ているページについて質問しても回答は得られない。特に利用するのに特別な設定は不要です。この機能が使えない場合、最新のChromeにアップデートしましょう。

入力して実行するとGeminiチャットのページに飛んで回答が出てきます。新しいタブで開かれるわけじゃないので、現在見てるページから移動したくない場合は、新しいタブを開いてから作業をすると良いでしょう。

図:Chromeから直接Gemini

DevtoolでGemini

Chromeのデベロッパーツールはウェブアプリ開発者にとってはなくてはならないものです。しかし、Consoleで表示されたエラーについては不可解なものも多く、結局検索エンジンで検索していたりします。

最新のChromeではこのConsole上のエラーに対して、「Understand this error」という形でGeminiに直接問い合わせして内容を調べる事が可能です。こちらは事前に設定変更が必要です。但し、DevtoolのUIが現在は英語でないと使えない

  1. F12キーを押してDevtoolを開く
  2. 右上の歯車をクリックする
  3. ApperanceのLanguageをEnglish(US)に変更して、一旦Devtoolを閉じる
  4. 再度F12キーを押してDevtoolを開く
  5. Preferenceの下の方にあるUnderstand console messages with AIのチェックを入れる
  6. これで、Consoleにエラーが出てる場合、見上に💡のマークとUnderstand this errorというのが出るのでクリックする
  7. 初回のみ利用許諾やリーガルの承諾の画面が出るので指示に従ってチェックを入れてNextやContinueをクリック
  8. すると、エラー内容を読み取って、どういうエラーで?対処法は何かを提示してくれる。英語だけど

図:ここからエラーについて直接聞ける

図:この設定をオンにする

図:利用許諾について承諾が必要

図:リーガルについて。チェックを入れてContinue

GoogleレンズでGemini

最新版のChromeではページを開いてアドレスバーをクリックするとGoogleレンズというボタンが出てきます。そのボタンをクリックして、現在見ているページの画像にドラッグアンドドロップすると、画像検索が始まり、続けて質問するとAIが質問に答えるというGoogleレンズ + Geminiが動くようです。

ただ自分の環境では検索までしかしてくれなかった。まだ展開されていないのか?

図:ネペンテスについて画像検索

雑感

Google I/Oの前にOpenAIがChatGPT-4oをぶつけて来た内容を見て、さらに自身のGASでの利用なども含めて語ってみると、正直、Gemini for Google Workspaceは時期尚早というか他のAIサービスの進化の具合からしても、利用方法の提示にしても「イノベーションを感じない後追い」でしかない印象。

確かに画像生成などやGoogle Documentのhelp me writeは良いとは思うのだけれど、OpenAIの3週遅れ感が否めない。

日本語化対応が1年以上行われなかったことで印象が悪いのは否めず、また現在の機能で日本国内企業でこれを導入して使うのにこの価格はちょっと高いというのが結論。同じ金額出してChatGPTのAPI使ってGoogle Workspaceのアドオンでも作ったほうが全然良いもの作れると思います。

これでGemini for Google Apps Scriptが出るのであればまだ期待値はあるのだけれど、GPT-4oのご披露された内容を見ると、画像OCRで表形式をバッチリ抜ける観点からしてGAS利用上もChatGPTのAPI使ったほうがマシなものが作れそう(特にインボイス対応などでは光る)。

現時点ではこれはGWSユーザに無償開放で提供すべきレベルなのではないでしょうか?

※ChatGPTはすでにコード画面見ながらメンターやってくれるようです。ChatGPTのデスクトップ版アプリですね。

生成AIのこれからの可能性

ここではGemini for Google Workspaceに限らず、現在発展中の生成AIが呼び起こす社会変動やユーザレベルでの活動などをまとめています。生成AIについては以下の動画非常にわかりやすいのでオススメです。

まだ、生成AIは要素を加えて目標に到達する観点では優れていますが、組み合わせていくであったり、減らして目標に到達する(例:医薬品のポリファーマシーの考え)といった考えが苦手なのでこのあたりがクリア出来るようになると一気に世の中に浸透することになるでしょう。

【一般教養】生成AIとは何なのか?

図:AIが見守る時代も来るかも

ChatGPTの進化がヤバい

2024年5月13日、ChatGPTがGPT-4oを発表してからウェブ上で進化がヤバいという声が相次いでいます。実際に自分もGPT-4oを試してみました。自分の視点はプログラマブルに処理できるかどうか?実際にこちらの請求書を読み込んでみました。結果はバッチリデータを抜き出せてる。こりゃ、ChatGPT-4oだけでエントリー出来るくらいの時代の転換点来てるかもしれん。1年前にアルトマン追放劇があった会社とは思えない。

自分の視点で見た時のこのヤバさというのは、他の人の視点とは異なり、これまでのGASで実装していたものも含めて列挙すると

  • GoogleのVision APIとか必要なくなります。
  • Googleの翻訳APIもいらなくなります。
  • 同様のことがClaude APIでも可能です。

といった具合に、数々のAPIでもってそれぞれで実装していたような機能が、ChatGPT APIで1本化できちゃうって事です。他の音声文字起こし系のAPIもきっと要らなくなるでしょう。開発スタイル変わっちゃうよコレって話です。ChatGPTがコード生成してくれるとかそういうレベルすらも超えてしまってる。Geminiさん、これ追いつけそう?なんで、GeminiでBlogの記事自動翻訳して全世界同時リリースとかしないの?という心配が。

つまりGCPの数々のAPIで複雑な料金体系と難解なリクエストを組み立てて送らずとも、一発でパキーンっと答え得られてしまうので人間の職が奪われるだけじゃなく、こういったAPIにて受託開発でご飯食べてる会社も終了のお知らせということになります。逆にペッパー君にChatGPT乗っけて復活させれば、Detroit: Become Humanの時代到来です。

さらに言えば、チャットだけじゃなく画像生成も、おまけにAlexa同様喋るようになった(声質はスカヨハみたいだそうで。)のであらゆる業務をおまかせドライブ出来ちゃう結果、他の画像生成AI系サービスやAmazonの音声AIサービスも追い込まれることになります。Google AssistantやAlexaがリストラされてしまうかもしれません。

※ただ、相変わらず嘘はつくみたいです。ハルシーネーション感はGPT-4oでも健在。

図:ファイルを添付してOCR指示を出してみてる

図:バッチリ表のデータも機械的に取れそう

Google Apps Scriptで画像から文字起こしを実現する【GAS】

Google Driveで始める電子帳簿保存 & インボイス制度対応

Google Apps ScriptとCloud Speech APIで文字起こし【GAS】

将来予測

概要

正直なところ、AIには期待しつつ確かに凄いという確証を得つつも、日本という箱庭に住んでいると自分には無関係という意識が働きがちで、自分は大丈夫と思いがちなのですが、わずか1年ちょっとでここまでの進化を見せ付けられると、これは確かにパラダイムシフトであり、シンギュラリティに到達するのも時間の問題だと感じました。

自分の人生でも前述の通り、Win95とスマフォという2つの大きなパラダイム・シフトが起こり、世界のルールがガラっと変わったなと言う経験に匹敵する出来事がAIの進化だと思います。

さて、それらを踏まえて10年後の予測を2つのChatGPTに予想してもらいました。テーマは以下の通り。概ね自分の考えてる未来もこんな感じ。さっさと稼いで山奥の畑と一軒家で隠居するか?この世界で戦い続けるか?どっちかしかないんじゃないかなと。政治家・官僚のような人たちは置き換わって、火の鳥未来編のハレルヤみたいになられても困るけれど。

ただ1つ言えるのはこの未来は遠い未来のお話ではなくもうすぐ来る未来であるということ。

GPT-3.5

GPT-4o

その他

GAS Interpreter

ChatGPT研究所よりリリースされているという、ChatGPTのプロンプトを経由してリクエストを投げるとGASを後ろで実行して処理まで行ってくれるというトンデモナイものです。それがGAS Interpreter

フリーで公開されてるわけじゃないので自分は試せていないのですが、ChatGPTやGemini for Google Workspaceがいまいちもの足りないなという点は、リクエストに対して答えを返すに終始してて、実際のアクションは自分がやらないと行けなかった点。そこまでわかってるなら、やっちゃってよが出来るのがこの仕組み。

GASで出来るあらゆることが出来るということなので、情シスの管理業務でも利用できそうですが反面怖い気もする。

AGIラボ限定のものだそうなので興味ある方は加入してみてもよいのではないでしょうか?

生成AIツール for Excel

Gemini for Google WorkspaceおよびChatGPT4の最新情報を漁っていたら見つけたのがこの生成AIツール for Excel。Gemini 1.5Pro対応のExcel用のアドインだそうで、APIキーを登録するとすぐ使えるようになってるのだとか。GPT-4 TurboやClaude3 Opusにまで対応してるので主要な生成AI系に対応してることになる。

Excel 2016以降で利用することが可能で、このアドイン自体はこちらから無料でダウンロードして使える。

機能としては各種AIの機能をExcelの関数として実装してるので、関数を入力して使える手軽さがあります。

もともとはmacOSのメニューバーで色々操作できるブラウザという位置づけのソフトウェアでしたが、v0Dify、Claude、Geminiといった生成AIをいつでも呼び出せるプロンプト機能を搭載しました。

Mac AppStoreにて入手可能ですが利用するにはアプリ内課金が必要です。

Google Apps Script Expert

ChatGPT用のGPTsとして、リリースされているGoogle Apps Script生成専用のGPTsがGoogle Apps Script Expert。日本語にも対応しているようで、GAS初心者が利用するには良いかもしれない。

指示を出すだけでChatGPTがGASのコードを生成してくれる上で最適化してるらしいですが、現実的には既存のコードの改良や、エラー処理などどちらかというとアフターフォローやメンターな面で活用すると良いのではないかと思います。

ChatGPTに限らず、今現在はどこの生成AIも一歩踏み込んだスクリプトとなると見当違いなコードが出てくることがしばしばあるので、逆に初心者の場合「沼る」可能性があります。

サインアップして使うだけなので、料金等掛からず使えます。

図:サインアップしてみた様子

Gemini for Google Apps Script?

2024年10月、先日突如として登場したウェブページ。何かの投票ページのようで、Gemini for Google Apps Scriptでも出るのか?といった様子のページで動画が一個おいてあります。

「日本以外では、めったに使用されないからでしょうか?」等という意味不明な文章がありますが、Google Trendsでは確かに日本でのGAS利用は多い方に位置していますが、ウェブ上の資料やそのクオリティは圧倒的に海外です。それはStackOverflowの投稿頻度をみてもわかります。

さて、投票しておきましたが実装されるのか。。

CopilotのほうはCopilot for Power Automateが既にリリース済みであり、AppSheetもGemini in AppSheetが出ていますが、GASが出遅れてる感はあります。

Introducing Gassistant [Gemini competition]

動画

Googleの生成AIGeminiのライブラリを作ってみた【Uipath Studio】-- わかりやすく使い方を解説!ーにーぶ7のUipath備忘録

Introducing GPT-4o

Unlocking efficiency with Gemini for Google Workspace

DAY 1 基調講演(JA)

Google発表のAIをチームメイトにする「AI Teammate」が企業の組織力をグンと高めるかも #AI #AITeammate #shorts

関連リンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)