GPT-4Vとは、OpenAIのChatGPTに導入された大規模言語モデル(LLM)です。2023年9月25日にリリースが発表されました。
従来のChatGPTはテキストによる対話限定でしたが、GPT-4Vの画像認識機能が追加され、画像を利用しての視覚的な対話が可能となりました。最新の機能をもつGPT-4Vは応用範囲が非常に広く、多くのユーザーが注目しています。
この記事ではGPT-4Vの使い方を10例と、具体的な使い方を紹介します。
GPT-4Vは、ChatGPTの有料プランでのみ利用可能です(2024年7月時点)。GPT-4の料金プランについては、以下の記事で詳しく紹介しています。
GPT-4Vの使い方事例10選
GPT-4Vは、アップロードした画像内の情報を読み取り、質問への回答や提案・アドバイスをしてくれます。具体的な使い方として10の事例を紹介します。
写真の解説
GPT-4Vを使って妻の写真を解説してもらったんだけど、これどんどん精度が上がったらとんでもないことできるよw
例えば、場所の名前とかは忘れたけど画像はあるからGPT-4Vで解説してもらったりできるしいろいろとやれることあるよね! pic.twitter.com/USuJKmdB4I
— J.J.J (@sml_J_J_J) November 6, 2023
画像の提示だけで画像解析をして、場所や状況などさまざまな情報を提供してくれます。使い方も簡単です。
資料の解読
読みにくい資料や難易度の高い資料を示すだけで、要約や解読などの処理をしてくれます。資料把握の時間短縮に効果的です。
グラフや図表の読み取り
GPT-4Vの画像認識、グラフや図表の読み取りにも使えるので、普段の業務でもかなり使い道ありそう。 pic.twitter.com/C0zEsIfC34
— Dory | ネオ事業 × AIエージェント (@dory111111) September 27, 2023
GPT-4Vはグラフや図表の言語化も可能です。工夫次第で作業効率向上に役立ちます。
画像内の文字をテキスト化
【GPT-4Vの意外な使い方】
画像内の文字をテキスト化出来るって知ってますか?例えば、添付の画像を貼り付けて、「この画像に書かれている文字をテキスト化して下さい」と入力した結果がコレ・・。
副業の理由
手取り収入/小遣いを増やしたい: 61.2%
安定時給を得られる場所が他になかった: 24.8%… pic.twitter.com/TcDzZMB8yW— くまごろう@「AI×Kindle」の人 (@kumakumachikuma) November 3, 2023
GPT-4Vは画像解説だけでなく、画像から読み取る情報のテキスト化にも対応しています。
複数言語の翻訳
GPT-4Vは英語のほか日本語などの多言語に対応しており、テキストの読み込みと同時に翻訳もしてくれます。
アーキテクチャ図の解説
個人的に一番重宝しているGPT-4Vの使い方。 pic.twitter.com/qVUCOmPEQ9
— 市川航平 | KK Generation 共同代表パートナー (@koheiichi) October 8, 2023
理解が難しいアーキテクチャ図などのデータも、GPT-4Vに託せば分かりやすく解説してくれます。
画像内のアイテムの用途説明
6.画像内のアイテムの用途を説明させる
特定のアイテムを撮影して用途を説明させたり、初めて見る商品の用途に悩む場面や説明文を読んでもピンとこないときなどでも、GPT-4Vを使えば質問内容に合わせて回答してくれます。
特に海外製品や、海外旅行時に調べる手間が省けそうですね。
— とし坊@副業xAIスキルでマネタイズ (@magicpen2006) October 11, 2023
画像を示すだけでアイテムの用途を教えてくれるなんて便利ですね。使用アイデアを提供してもらえば、アイテムの活用の幅も広がりそうです。
料理レシピの提供
GPT-4V!完全には再現はできないけど写真から読み取れる料理のレシピを教えてくれる!すげーぜ! pic.twitter.com/GQkDDXmW3c
— tak (@kansai_777) September 27, 2023
料理の写真からレシピや必要な材料を教えてもらえるのは便利ですね。家事負担軽減にも効果的です。
アクセサリー選びの相談
GPT-4Vに画像を見てもらいながらアクセサリー選びの相談したらめちゃくちゃ捗った……
たぶん洋服のスタイリングのアドバイスもくれると思うから、すごく便利だと思う— リーリャ (@ashkah) October 25, 2023
ファッションアイテムやデザインなどの相談ができるのは、画像に対応した言語モデルだからこそですね。ユーザーの幅も活用範囲も無限に広がります。
食事のアドバイスや海外旅行のサポート
食事画像からの栄養分析や海外旅行のサポートなど、お抱えコンシェルジュのように使えるツールです。
GPT-4Vの使い方
GPT-4Vの基本的な操作手順を解説します。
ChatGPTでの画像読み込みのやり方【PCの場合】
PCなどWebページでは、以下の手順で画像読み込みが可能です。
- New Chat入力画面下の、メッセージボックスの左側にある画像添付アイコンをクリック
- 画像を選択してアップロード
- プロンプトを入力
- [↑]ボタンをクリック
以上の手順でやり取りを進めると、ChatGPTからの回答が得られます。
ChatGPTでの画像読み込みのやり方【スマホアプリの場合】
スマホアプリでは以下の手順で画像を読み込み、プロンプトを入力して、ChatGPTからの返答を待ちます。
- New Chat入力画面下の、入力欄の左側に表示されている[+]マークをタップ
- 画像を選択して、メッセージボックスにプロンプトを入力
スマホアプリでの音声入力方法
スマホアプリでは、以下の手順で音声入力が可能です。
- New Chat入力画面の下、入力欄右側のヘッドホンアイコンをタップ
- 読み上げ音声の選択画面表示
- 好みの音声を選択
- アプリ使用時のマイク使用を許可
- マイクに向かってプロンプトを指示
- 言語を自動認識
- 回答生成完了後に指定した音声で読み上げ
音声選択は[Setting]で変更可能です。回答の生成が完了してから音声で読み上げるため、少々時間がかかります。AIからの回答はテキストでもチェック可能です。
GPT-4Vの使い方は無限大
ChatGPTに目や耳の役割をもたせるGPT-4Vは、OpenAI開発の新機能搭載モデルです。高度な技術により、テキストチャットのやり取りとは比較にならないほどに活用範囲を広げてくれます。
GPT-4VはPlus以上の有料プランでのみ利用可能です。興味のある方は検討してください。
ここではGPT-4Vの使い方10例を紹介しましたが、使い方はアイデア次第。可能性は無限大です。AIの目と耳を駆使して、さらなる業務効率化や事業展開に活用していきましょう。
フリープランなら、クレジットカードの登録が不要で永年無料。
今すぐ記事作成に特化した次世代のAIツールをお試しください。
フリープランならずっと無料
無料で利用する