KZ
item
Негізгі бет
Трендинг
Журнал
Ұнаған бейнелер
Ең жақсы KZitem
Фильм және анимация
Автокөліктер мен көлік құралдары
Музыка
Үй жануарлары мен аңдар
Спорт
Ойындар
Комедия
Ойын-сауық
Тәжірибелік нұсқаулар және стиль
Ғылым және технология
Кіру
Тіркелу
Кіру
Тіркелу
Негізгі бет
Трендинг
Журнал
Ұнаған бейнелер
Ең жақсы KZitem
Фильм және анимация
Автокөліктер мен көлік құралдары
Музыка
Үй жануарлары мен аңдар
Спорт
Ойындар
Комедия
Ойын-сауық
Тәжірибелік нұсқаулар және стиль
Ғылым және технология
Негізгі бет
OpenAIのGPT4oは本当に圧倒的に強いのか?解説してみた
Күн бұрын
OpenAIのGPT4oは本当に圧倒的に強いのか?解説してみた
Рет қаралды
10,689
にゃんたのAI実践チャンネル
1
1
Жүктеу
Пікірлер: 36
@re-sato4458
4 ай бұрын
今回のGPT-4oは、あくまでマイナーチェンジかなと思います! Open AIは、わざと競合よりも少しだけ性能をアップさせている印象です笑 それでもこの賢さは素晴らしいですし、より実用的です! 現在も仕事でガシガシ使っていて、精度がかなり上がっていることを実感しています! GPT-4oの一番の利点は、何度リクエストを投げても制限がかかりにくくなった点です! 実用性の面では圧倒的にGPT-4oですねー。 以前、課金してOpusも使っていましたが、GPT-4oの方が👍
@aivtuber2866
4 ай бұрын
確かに今回は、音声対話機能がメインで そのために速度重視にしただけで 性能が高いモデルも持ってそうですよね😆 GPT-4o回数制限緩いのもヘビーユーザーにとっては嬉しいですね😊
@hassy3001
4 ай бұрын
いつも勉強させて頂いております。 GPT-4oの強みは、マルチモーダル性にあると聞いたことがあります。全てのタスクを、一つのモデルで扱うこと、個々の性能で見ると下がるけれども、総合的性能では向上する。なのであえて、言語モデルに特化したGPT-4も選択できるのかなと思っています。
@aivtuber2866
4 ай бұрын
ありがとうございます! おっしゃるように音声とか画像などを含めて利用したい時はオムニを使って テキストのみの場合は、GPT4を使うとか使い分けも良いかもしれませんね🤔
@goisesan
4 ай бұрын
精度とは違った観点での比較も気になります…!個人的にはGPT4oは丁寧で文章が長くなる傾向があり要領を得てないなと感じることもあるのですが、Gemini1.5proは取捨選択できていて会話しやすくコミュニーケーションが気持ちいいなと感じます。これ精度とは違う論点ですよね?実装方針の違いとかあるのかなあと。たぶん多くのユーザーにとっては数%の精度の違いよりUXが優れてる方を選ぶん気もするんですよね。なんだかよく分からないので解説いただけると非常にありがたいです🙇♂️🙇♂️🙇♂️
@aivtuber2866
4 ай бұрын
ありがとうございます! 単純に正しさとは別で、モデル毎に出力する文章の特徴(GPT4oは長い、Opusはユーザーに寄り添うなど?)があったりしますよね! そこらへんは好き嫌いもあるかもですが、 Gemini 1.5 Proも使い込んでみて各モデル解説できたら良さそうですね!🤔
@takaneABC
4 ай бұрын
88.7%でも86.8%でもいいのですが、誤差の範囲だと思います。 ところで、ここまでくるとそろそろLLMの限界まで来ているように思えます。 もし、GPT5が出て、性能が92%とかになったら、LLMは限界にきていると解釈できないでしょうか?
@madeinhokkaido816
4 ай бұрын
4oは嘘をつくのが巧みになっている印象です。Tableauに関して言えば、完全にGPT4>4oですね。一方で、RAGの精度については、4oはかなりのものですね。
@aivtuber2866
4 ай бұрын
ありがとうございます! 精度が上がっていくとハルシネーションも巧みになっていくのかもしれませんね・・・笑 GPT4に切り替えて検証はしていませんでしたが 確かにタスクによっては最適なものを探すの良さそうですね😲
@tatami204
4 ай бұрын
言語モデルの比較データは英語でのパフォーマンスですよね?日本語だと結果がかなり違うのではないでしょうか。個人的にはGPT-4oよりもClaude3のほうがはるかに疎通性が高い気がします。
@aivtuber2866
4 ай бұрын
おっしゃるように日本語だと結果が変わってきそうですね! Claude3の方がユーザーに質問を投げかけてくることが多く 対話として意図を伝えやすいように感じますよね~🤔
@salmon54561
4 ай бұрын
API経由で使う時は、レスポンスの速さが求められるケースも多いと思います。Groqのモデルが、あまり日本語が得意じゃないということで、4oは性能が高いのに速いので結構アドバンテージがあると思います!
@aivtuber2866
4 ай бұрын
実用性を考えたら速さも重要な評価指標ですよね! 読んで理解するスピードより速く出力されている気がするので 対話用途ではこれ以上は必要ないかもですが・・・笑
@tststs2222
4 ай бұрын
AIモデルさんたちも、インスタの自撮り画像盛りまくっちゃうお年頃お嬢さんみたいな感じですね^^
@we-iz503
4 ай бұрын
AIモデルは精度の高さが命だからしょうがない
@riho-u5g
4 ай бұрын
プログラミングに関する精度に関しては、GPT4>GPT4oだって言ってる人も結構いる印象がある気がしますねぇ
@aivtuber2866
4 ай бұрын
ありがとうございます! 他のコメントでもGPT4の方が良いという方もいたのでここらへんは結構気になりますね🤔
@takahironakagawa7730
4 ай бұрын
Gemini1.5proも凄いですが、本当に凄いのはGemini1.5flashだと思います。はっきり言って値段設定がおかしいと思うレベル。 しかも、100万トークンまで使えますしね。 APIを使うサービスでは、Gemini1.5flash以外選択肢はないのではと思いますね。
@aivtuber2866
3 ай бұрын
あまり注目されていない?気がしますが flashコスパめちゃくちゃ良いですよね😆
@近藤宏二-f5q
4 ай бұрын
にゃんた様へ 本当に技術用語やリテラシーが凄いですね❗ 僕なんかはまだよろよろというスピードでございます。
@aivtuber2866
4 ай бұрын
ありがとうございます! 私もわからないことだらけで勉強中ですよ😆 マイペースで頑張りましょう😊
@kinpatsumania57
3 ай бұрын
Claude 3.5 Sonnet…いきなり何やらすごいものが出てきましたね…(ボソッ
@aivtuber2866
3 ай бұрын
めちゃ凄そうで撮りたかったのですが 外出中で撮れず‥😢
@user-fd7pg6lk6n
4 ай бұрын
チャットGPTにアップしてもテキストが、抽出できませんでした。と表示されてしまうPDFがあるのですがどんな原因と解決策が考えられるか教えてもらえないでしょうか😢
@aivtuber2866
4 ай бұрын
私も手元で再現できていないので解決策が提示できませんが、 画像などがPDFに含まれていると テキストとして認識できずエラーが出ているのかもしれません・・・! ADAで読み込んでいると思うので、エラーページは無視してテキストを抽出してください などとプロンプトを入れたらどうなんでしょう🤔
@brown0101
4 ай бұрын
GeminiはCoTなしなんでしょうか?
@aivtuber2866
4 ай бұрын
画像の評価に関してはCoT無しだと理解してます!
Пікірлер: 36