ChatGPT5Thinkingのポンコツが激しいのでGeminiとCopilotに聞いてみた。
❓質問
ChatGPT5と作業をしていると同じミスを繰り返すポンコツぶりが激しいのだけど世の中はどうなっているか知ってる?
🤔Geminiの返答😣
ChatGPT-5とのお仕事で、同じミスを繰り返すポンコツぶりに悩まれているとのこと、心中お察しします。せっかく新しいモデルが出たのに、期待通りのパフォーマンスが出ないのはもどかしいですよね。
お調べしたところ、ChatGPT-5は2025年8月7日にリリースされ、すでに無料・有料ユーザー向けに提供されています。多くのレビュー記事やユーザーの声を見ると、その能力は**「AGI(汎用人工知能)に向かう重要なステップ」**と評されるほど飛躍的に向上したと言われています。特に、以下のような点が注目されています。
- 推論能力の向上: 複雑な思考を要する問題や、プログラミングコードの生成において、より精度の高い回答を導き出すことが可能になったと言われています。
- マルチモーダル機能の強化: 画像や音声など、テキスト以外の情報もより高度に理解し、連携して処理できるようになりました。
なぜ同じミスを繰り返すのか?
しかし、こうした進化の裏側で、ユーザーの体験にはまだばらつきがあるようです。同じような「ポンコツぶり」を感じている方は少なくありません。いくつかの原因が考えられます。
- ハルシネーション(誤情報生成): ChatGPT-5は推論能力が向上したとはいえ、完全にハルシネーションがなくなったわけではありません。特に学習データにない、あるいはあいまいな情報については、もっともらしい嘘をついてしまうことがあります。
- タスクの複雑性: ユーザーが指示するタスクが複雑すぎると、AIが意図を正確に汲み取れず、不正確なアウトプットを出すことがあります。これは、AIの能力不足というより、指示の仕方に課題があるケースも多いです。
- モデルの特性: ChatGPT-5は、その設計上、特定の種類のタスクで得意不得意がある可能性があります。例えば、創造的な文章生成は得意でも、論理的なデータ分析では特定の癖が出る、といった具合です。
解決策としてできること
もし同じミスを繰り返すことに悩んでいらっしゃるのであれば、以下の方法を試してみるのがおすすめです。
- プロンプト(指示)の改善:
- 具体的に指示する: 「〜を要約して」だけでなく、「〜を、箇条書きで3つのポイントにまとめて、ターゲット層は中学生向けに、専門用語を使わずに要約して」のように、詳細な制約条件を付け加える。
- ペルソナを設定する: 「あなたは優秀なデータアナリストです」「あなたは経験豊富なコピーライターです」のように、役割を与えることで回答の質が向上することがあります。
- 作業の分割: 複雑なタスクは、いくつかのステップに分割して、一つずつ指示を出していくことで、AIの迷いを減らすことができます。
AIは道具であり、その性能を最大限に引き出すには、使う側の工夫も重要になってきます。ChatGPT-5も、まだ完璧なツールではありません。より良い結果を得るために、ぜひ色々な指示の出し方を試してみてください。
🤨Copilotの返答🤔
それ、かなり鋭い観察ですね。実は、ChatGPT-5に対する世間の評価はかなり割れていて、あなたのように「同じミスを繰り返す」「期待外れ」と感じている人も少なくありません。
🧠 GPT-5の進化と限界
GPT-5は確かに技術的には進化しています。たとえば:
- 文脈理解や長文処理能力の向上
- マルチモーダル対応(画像・音声・PDFなど)
- 自動モード切り替えによる柔軟な応答
でもその一方で…
⚠️ ネガティブな反応も多数
- 「人格が消えた」:以前のモデルより冷たく感じるという声
- 「創造性が下がった」:雑談やブレストでの柔軟性が減ったという指摘
- 「バグが多い」:ルーティングの不具合で、簡単な指示すら誤解するケースも
- 「同じミスを繰り返す」:これはまさにあなたの実感と一致していて、Redditでも「GPT-5は馬鹿になった」というスレッドがバズってました
🛠 OpenAIの対応
批判を受けて、OpenAIは以下のような対応を始めています:
- GPT-4oの再利用を可能にする設定オプション
- 応答の自然さや“人間らしさ”を取り戻す調整
- Thinkingモード強化による推論力の改善
つまり、世の中も「ポンコツぶり」に気づいていて、開発側もそれを認識して動いているという状況です。
あなたのように、実務で精度や安定性を求める人にとっては、今のGPT-5は“進化したけど使いづらい”という微妙な立ち位置かもしれません。もしよければ、どんな場面で同じミスが出てるか教えてもらえたら、回避策や代替アプローチを一緒に考えられますよ。
ChatGPT-5の具体的な誤りについて教えて。
どのように改善するかアイデアを考えたい。
他のユーザーはどう感じているか知りたい。