Googleが新しい高性能AIモデル「Gemini」シリーズを発表しました。クラウドを経由せずスマートフォン上で動作する最もコンパクトなモデル「Gemini Nano」は、即日提供されたアップデートによってPixel 8 Proで利用できます。
Gemini Nanoで利用できる機能は現時点で2つ。1つは、標準の文字入力アプリGboardがメッセージの文脈を読み取って返信内容を提案してくれるスマートリプライで、もう1つは音声を記録してリアルタイムで文字起こしできるレコーダーアプリの要約機能です。
Gemini Nanoを利用するために必要な2023年12月のアップデート提供には時間がかかっているようですが、手元のPixel 8 Proではレコーダーアプリの要約機能をすぐに利用できたので早速使ってみました。
GeminiはGoogleが作ったAIモデルで、意欲的に質問に答えます。大量のデータから学ぶことで、人間と同等の会話を可能にします。メリットとしては、高度な知識がなくても素早く正確な情報を得られます。しかし、人間のように完全に理解や感情を持つわけではありません。
音声メモの要約機能には1.4GBが必要
レコーダーアプリのAI要約機能を利用するには、英語の音声メモを選択して「文字起こし」タブに表示される「要約」ボタンを押すだけ。
最初に要約機能を利用する場合は、AIで生成される情報が不正確または不適切であるとの注意メッセージが表示され、大規模言語モデルを使用することからAIモデルのダウンロードが必要と案内されます。
AIモデルのダウンロードが完了すると、Gemini Nanoが生成した3行の要約が表示されます。
生成された要約に誤りはないものの、大したものではありません。また、同じ要約が繰り返されたり、要約できなかったり、音声データが長すぎる/短すぎる場合は要約そのものができなかったりと、実用的なレベルに仕上がるには時間がかかりそう。なお、要約に不満がある場合はフィードバックすることもできます。
ちなみに、ダウンロードが完了するとAI Coreアプリのユーザーデータ容量が4KBから1.43GBまで大幅に増加していました。
Googleが公開しているリファレンスによると、Gemini Nanoにはメモリの容量に合わせて、Gemini Nano 1とGamini Nano 2といった2つのバージョンが用意されていて、後者の方が精度は高いとのこと。
Max Weinbachはレコーダーアプリの要約機能を追加するにあたってダウンロードが必要なモデルの容量からGamini Nano 2ではないかと推測しています。
コメントを残す