![Pixel 8 ProでGoogleの高性能AIモデル「Gemini Nano」を使ってみた](https://mobilelaby.com/wp/wp-content/uploads/recorder-app-summarize-gemini-nano-pixel-8-pro.jpg)
Googleが新しい高性能AIモデル「Gemini」シリーズを発表しました。クラウドを経由せずスマートフォン上で動作する最もコンパクトなモデル「Gemini Nano」は、即日提供されたアップデートによってPixel 8 Proで利用できます。
Gemini Nanoで利用できる機能は現時点で2つ。1つは、標準の文字入力アプリGboardがメッセージの文脈を読み取って返信内容を提案してくれるスマートリプライで、もう1つは音声を記録してリアルタイムで文字起こしできるレコーダーアプリの要約機能です。
Gemini Nanoを利用するために必要な2023年12月のアップデート提供には時間がかかっているようですが、手元のPixel 8 Proではレコーダーアプリの要約機能をすぐに利用できたので早速使ってみました。
GeminiはGoogleが作ったAIモデルで、意欲的に質問に答えます。大量のデータから学ぶことで、人間と同等の会話を可能にします。メリットとしては、高度な知識がなくても素早く正確な情報を得られます。しかし、人間のように完全に理解や感情を持つわけではありません。
音声メモの要約機能には1.4GBが必要
レコーダーアプリのAI要約機能を利用するには、英語の音声メモを選択して「文字起こし」タブに表示される「要約」ボタンを押すだけ。
最初に要約機能を利用する場合は、AIで生成される情報が不正確または不適切であるとの注意メッセージが表示され、大規模言語モデルを使用することからAIモデルのダウンロードが必要と案内されます。
![Gemini Nanoを使った音声の要約機能](https://mobilelaby.net/images/2023/12/gemini-nano-recorder-summarize-2.jpg)
![Gemini Nanoを使った音声の要約機能](https://mobilelaby.net/images/2023/12/gemini-nano-recorder-summarize-3.jpg)
![Gemini Nanoを使った音声の要約機能](https://mobilelaby.net/images/2023/12/gemini-nano-recorder-summarize-5.jpg)
![Gemini Nanoを使った音声の要約機能](https://mobilelaby.net/images/2023/12/gemini-nano-recorder-summarize-7.jpg)
![文字起こしが短すぎます](https://mobilelaby.net/images/2023/12/gemini-nano-recorder-summarize-e1.jpg)
![要約を作成できません](https://mobilelaby.net/images/2023/12/gemini-nano-recorder-summarize-e3.jpg)
AIモデルのダウンロードが完了すると、Gemini Nanoが生成した3行の要約が表示されます。
生成された要約に誤りはないものの、大したものではありません。また、同じ要約が繰り返されたり、要約できなかったり、音声データが長すぎる/短すぎる場合は要約そのものができなかったりと、実用的なレベルに仕上がるには時間がかかりそう。なお、要約に不満がある場合はフィードバックすることもできます。
ちなみに、ダウンロードが完了するとAI Coreアプリのユーザーデータ容量が4KBから1.43GBまで大幅に増加していました。
Googleが公開しているリファレンスによると、Gemini Nanoにはメモリの容量に合わせて、Gemini Nano 1とGamini Nano 2といった2つのバージョンが用意されていて、後者の方が精度は高いとのこと。
Max Weinbachはレコーダーアプリの要約機能を追加するにあたってダウンロードが必要なモデルの容量からGamini Nano 2ではないかと推測しています。
![Pixel 8 Pro](https://mobilelaby.net/elements/pixel/8/pro-thumb-500x500.jpg)
コメントを残す