まるく堂の〇〇やろうぜ!

ニュースや日々の生活において思う事を綴っていくブログです。

「GPT-4o」登場!音声と視覚理解が強化された驚異のAI

スポンサーリンク

新モデル「GPT-4o」がスゴい!無料でお試しもできるよ!!

こんばんは!まるく堂です!
今回はOpenAIの新しいAIモデル「GPT-4o」についてご紹介します。

「GPT-4o」と書いて「ジーピーティーフォーオー」または「ジーピーティーフォーオムニ」と読みます。

「Omni(オムニ)」とはラテン語で「すべて、あまねく」と言う意味だそうです。

最近発表されたこのモデルは、従来の「ChatGPT」よりも音声と視覚の理解能力が強化されているのが特徴です。

「GPT-4o」はさらに、多言語対応やテキスト処理能力も大幅に向上しています。

この記事では、GPT-4oの特徴や性能、そして実際に私が無料版・有料版を使ってみた感想も含めてお伝えします!!

 

GPT-4oの特徴

GPT-4oは、音声と視覚の理解能力が強化されています。画像認識を通じて情報を理解し、それに基づいた回答を生成することができます。従来のモデルに比べて、その処理速度や精度がかなり向上しています。

↓こちらはある方のXの投稿なのですが…

この方は漫画のページをGPT-4oに読み込ませ、どんなシーンなのかを尋ねてみたところ、非常に詳細にシーンの説明を始めました。

このようにGPT-4oは音声認識や画像理解の精度も高く、複雑なタスクに対応でき、

そしてここが大事なのですが反応がとても早い!!

ユーザーとのやり取りがよりスムーズになっていて、ほぼストレスフリーなんです。

これによって、使い勝手が大幅に向上した様に思います。

 

利用シーンと応用例

GPT-4oの発表は私個人にとってもかなりの驚きでした。

すでにビジネス、教育、医療などさまざまな分野で活用されていますが、今まで以上に実用に耐える仕様になっているので、カスタマーサポートの自動化やデータ解析、個別指導の補助、診断支援や医療記録の整理など、さまざまな業務の効率化と質の向上が期待できそうです。

個人的に現在使ってるのは「画像の文章からテキストを読み込む」と言う作業ですね。

いわばOCR(文字認識)機能の事です。これは以前のモデルでも使えてはいたのですが、今回の新モデルは本当に認識能力が上がっていて、かなり複雑な文章の並びになっていてもほぼ100%正確に読み取ってくれます。

これは一度ぜひ試して欲しい機能です。スマホで取った画像の文章がものの数秒でテキスト化されるのは本当にスゴいの一言です。

 

ユーザー向けプラン「無料版」と「有料版」の違い

今回は発表されたGPT-4oですが…

実はアカウントさえ作ればすぐに無料で使用することができるんです!!

通常は無料版だと一つ前の旧モデルしか使えない事がほとんでしたが、最新モデルが無料でも使えるなんて今まで無かった事です。

ただ、無料版では高性能な機能を試すことができるものの、使用時間やリクエスト回数に制限があります。

個人的な感覚では10回ほどチャットをすると、すぐに制限が来て、その後は旧モデルのGPT-3.5に切り替わってしまいました。制限がリセットされるには約3時間ほど待つ必要があり、お世辞にも実用性が高いとは言えません…

そのため、無料版はあくまでも体験版、お試し感覚での利用に向いていると思います。

有料版では、その使用回数の制限が緩和され、より多くの機能を利用できます。ただし、完全に制限がないわけではなく、ChatGPT Plusプランでは3時間あたり40〜50メッセージ程の制限があります。それでも一般的な使用には十分だと思いますし、

企業向けのプランでは、さらに高い使用量の上限を設定できるため、ビジネスでの本格的な利用に適しています。

 

「ChatGPT」今後の展望

GPT-4oは、さらなるアップデートが予定されています。特に注目されるのは、音声と画像を使った新しい対話機能ですね。

↓例えば、これは目の不自由な方がGPT-4oを搭載したスマホを片手にロンドンの街中を歩いてる動画なのですが…

www.youtube.com

男性はスマホをバッキンガム宮殿に向けます。

するとGPT-4oは彼にバッキンガム宮殿に現在旗が立っていて、旗があると言う事は国王がその建物の中にいることを示していると言った説明を始めます。

また、ある池の前ではアヒルが泳いでいるのですが、GPT-4oはその様子を事細かく男性に説明してくれています。

これらが非常に早いスピードでリアルタイムで行われてる事に驚きです。

この機能が目の不自由な方にとってもかなりの助けになるでしょうし、また様々な環境や人にも応用できそうな未来の技術であるのは間違いないでしょう。

 

↓こちらの動画ではスペイン語と英語のほぼ同時翻訳がGPT-4oによって行われています。

一方が英語で話すとスペイン語に、一方がスペイン語で話すと英語にそれぞれ翻訳してくれています。そのスピードが本当に脅威的です。

近い将来、翻訳者が仕事を失ってしまうのでは?と危惧してしまうくらいにスゴい技術だなと感じます。

 

こんな風に、ユーザーは音声でChatGPTと会話したり、画像をアップロードして質問したりできるようになります。音声機能はiOSやAndroidのモバイルアプリで利用可能との事です。こうした機能が近い将来、GPT-4oと言うアプリ一つで出来る様になるのは本当にスゴい事です。

 

まとめ:GPT-4oはこれまでにないほど強力なAIに返り咲いた!!!

今回はOpen AIの「GPT-4o」について書かせていただきました。

実は私、ちょっと前に「ChatGPT」の有料版を使うのを止めてたんですよ。

と言うのも、現在は「Gemini」や「Copilot」、「Claude3」とか色々出て来て、一部の機能では無料なのに「ChatGPT」を超える様なものまで出てきていて、課金してまで有料版を使う意味をあまり見いだせていなかったんですよね。

しかし、今回のGPT-4oの発表は驚きましたし、無料版でもこの新モデルを体験できた事により、その機能のすさまじさを思い知り、再度有料版を契約いたしました。

驚くのはその反応のレスポンスの早さですね、かなりストレスフリーになりました。

これは他のAIと比べても非常に早いし、かと言って回答も十分に練られたものになっていて、早さと賢さを兼ね揃えた様になっています。

 

これまで他のAIに一歩劣る様にも感じられた「ChatGPT」でしたが、

今回のGPT-4oは、今のところ最強と言っても良いくらいのAIツールに返り咲いた様に思います。

とは言え、AI競争はまだ始まったばかりと言っても過言ではなく、ライバル企業も手をこまねいている事は無いはずです。

今後AIはどうなっていくのか、非常に楽しみでもあり怖くもあります。

 

以上です…