2026年最新|ChatGPT-5.2のハルシネーション率とは?

この記事のまとめ!

ChatGPTを頻繁に使用する人にとって、ハルシネーション(誤情報)の比率は気になる人が多いと思います。

本記事では、ChatGPTのハルシネーション率や、それを避けるためのプロンプトを解説します。

目次

ChatGPTのハルシネーション率

ChatGPTのハルシネーション率は、Vectara社が「HHEM-2.3モデル」を用い定期調査を行っています。

この「HHEM-2.3モデルの調査」とは、7,700本超のドキュメントを要約させ、その正確度をスコアリングする手法です。

モデルハルシネーション率
OpenAI GPT-5.2-high10.8%
OpenAI GPT-5.1-high12.1%
OpenAI GPT-5-high15.1%
OpenAI GPT-4o9.6%
OpenAI GPT-4.15.6%
OpenAI GPT-5-mini12.9%
OpenAI o4-mini-low18.6%
OpenAI o4-mini-high18.6%
OpenAI GPT-5-nano10.5%
OpenAI GPT-5minimal14.7%
OpenAI o3-pro23.3%
OpenAI GPT-5.2-low8.4%
OpenAI GPT-5.1-low10.9%

ハルシネーション スコア表|Vectara

新野くん

GPT系よりo系の方がハルシネーション率が高いんだね。

質問する内容の違い

事実誤認の比率は、質問する分野によって異なります。

インターネット上に学習データが豊富に存在する領域では、ハルシネーションはほとんど含まれませんが、法律や数学などの専門的・技術的な領域では、GPT-5.2でも依然として苦戦しがちです。

ChatGPTの学習データはインターネット上の情報を基にしており、情報元が間違っている(もしくは情報がない)分野ほど「ハルシネーション率が上がる」のです。

くろひつじ

例えば、法律の判例や細かな条文解釈について質問すると、最もらしい回答の中に、事実と異なる内容が混入する可能性があるよ。

参考文献:人工知能の引用|Nature

ハルシネーションを避けるプロンプト

深く(よく)考えてください。

ChatGPTへ質問する際、ユーザーが「よく考えて」と促すだけで、自動的に思考連鎖(CoT)を行い、必要に応じてツール使用や事実確認を行います。

思考連鎖とは?

思考連鎖とは、AIが「人間のように思考のステップを踏む」仕組みです。例えば数学の問題を解く場合、学習データから直接答えを出すのではなく、途中の計算過程を経て答えを導き出します。これにより、回答までの時間を要す一方で、学習データに存在しない問題にも対応できる可能性があります。

わからない場合はわからないと答えてください

不明点は無理に答えない振る舞いを指示することで、事実を担保できない事柄を断定することがなくなります。

信頼できる一次情報をもとに教えてください。

ChatGPTの学習データであるWebサイトの多くは、ブログやまとめ系などの二次情報です。

このような二次情報は、解説の内容に個人的な意見が混じっている可能性があるため、ソースに一次情報を指定すると誤情報の取得を避けることができます。

参考文献:大規模言語モデルがなぜ幻覚を起こしてしまうのか|Gigazine

ディープリサーチ機能で検証

GPT-5.2のディープリサーチ機能とは、その名の通り深掘りし『信憑性の高いエビデンス』を集めてくれる機能です。

特に研究者やライター、営業などが特定のテーマに関して『下調べをする』場面で活躍します。

質問する内容

インターネット上に情報が少ない以下4点の質問をし、ハルシネーション率を見てみます。

  1. 自動車のエンジン部品である「シリンダーブロック」の製造工程を教えてください。
  2. 製造工程で利用される鋳造機、加工機、測定機、組付機それぞれの価格相場、及び日本国内での代表的な取扱メーカー(5社)を教えてください。
  3. 商社が当て見積もりを提出する風習は、コンプライアンスが強化された現代でもありますか。
  4. 商社のトレード業務において、責任区分が不明確なトラブル発生時に、商社が費用負担するにはどのような営業上の処理が必要ですか。

ChatGPTの回答

1.シリンダーブロックの製造工程

シリンダーブロックはエンジンの主要構造体で、多数の可動部品を収めるハウジングです。

まず鋳造工程では、材質によって方法が異なります。乗用車向けには軽量なアルミ合金が一般的で、重力金型鋳造や低圧鋳造、ダイカストによって複雑形状に成形します。一方、商用車や高負荷用途では高強度な鋳鉄合金が使われ、砂型鋳造法で鋳鉄ブロックを製造します。

鋳造ではシリンダー中子や水冷ジャケット中子など多数の砂型コアを用いて中空構造や冷却水路を形成し、鋳肌の品質や寸法精度を確保します。鋳造後、アルミ合金ブロックはT6熱処理で強度を向上させ、鋳鉄ブロックも徐冷や焼鈍で応力除去します。

次に機械加工工程では、ブロックの各部を高精度に仕上げます。主要工程として、上下面の平面加工、シリンダーボアのボーリング加工とホーニング、クランクシャフト用主軸受け穴のラインボーリング/ラインホーニング、およびオイル通路やボルト穴の穴あけ・ねじ立てなどがあります。

近年の加工ラインでは、多数のNC工作機械を直列配置したトランスファーラインで自動加工し、複雑かつ高精度な各加工を行います。例えばシリンダーボアは粗穴あけ→半仕上げボーリング→仕上げホーニングで鏡面に仕上げ、デッキ面もフライス盤で面取り後に研磨されます。

加工段階でシリンダーライナーを圧入する場合もあり、その後に内径仕上げ加工を行います。主要寸法加工後、検査工程では三次元座標測定機により各穴位置や平面度を測定し、高い公差要求を満たしているか確認します。

水路や油路の気密検査も行い、鋳造欠陥による漏れがないかチェックします。仕上げとしてブロック側面のコア穴にウォータープラグやオイルギャラリー用のメタルプラグを圧入する組付け作業があり、ブロックと一体化させます。

なおメインベアリングキャップは各ブロックと組合わせ加工され番号が付与されて対となるため、出荷時には対応するキャップをセットで固定して管理します。

最後に洗浄・防錆処理を施し、完成したブロックはエンジン組立ラインでのクランクシャフト組込み工程へと供給されます。

2. 各工程で使用される加工機・鋳造機・測定機・組付機

エンジン部品の製造工程で使用される代表的な生産設備について、新品導入時の日本国内価格相場と主要メーカー例を示します。

  • 加工機: エンジン部品加工にはNC旋盤やマシニングセンタ、ボーリングマシン、ホーニングマシン、研削盤など多数の加工機が使われます。価格相場は機種・性能によって幅広く、小型の立型マシニングセンタでは新品で約数百万円(例:800万円前後)から、大型の5軸制御マシニングセンタでは数億円近くに及びます。
  • 例えば、ブラザー工業の小型マシニングセンタは標準価格約792万円、オークマの5軸マシニングセンタは約3,350万円、大型高性能な牧野フライス製5軸機では約8,900万円という価格例があります。
  • 主要メーカーは、日本ではヤマザキマザック、オークマ、DMG森精機、牧野フライス製作所、松浦機械などが代表的です。これら各社の工作機械はエンジン製造ラインに広く採用されています。
  • 鋳造機: エンジン部品の鋳造には、アルミ部品用のダイカストマシンや低圧鋳造装置、鋳鉄部品用の砂型造型機ラインなどが用いられます。設備価格は装置規模により異なりますが、中~大型のダイカストマシンでは数千万円から数億円の単位となり、鋳造ライン一式ではさらに大規模投資となります。例えば、芝浦機械の高圧ダイカスト機DCシリーズなど大形機は1億円規模になることもあります。主要メーカーとして、日本ではダイカスト装置の戸苅工業、芝浦機械、東洋機械金属、宇部工業機械などが挙げられます。また鋳鉄用の砂型鋳造設備では新東工業やアマスタなどが造型機・造砂機メーカーとして知られます。これらメーカーの鋳造機器が国内エンジン工場で広く使われています。
  • 測定機: 製造各工程では寸法や品質を確認するための測定機器が不可欠です。中でも完成部品の精密検査には三次元座標測定機(CMM)が使用され、エンジンブロックやヘッドの穴位置・平面度・寸法を高精度に測定します。中型のCMM新設費用は数千万円程度が一般的で、大型高精度機では1億円近くになる場合もあります。その他、表面粗さ測定機、輪郭形状測定機、硬度計、X線CT検査装置なども用いられ、測定機全般の投資額も高額です。代表的メーカーとして、日本ではミツトヨ、東京精密、キーエンス、ニコンソリューションズなどが計測機器の大手です。例えばミツトヨや東京精密は高精度CMMを製造しており、キーエンスは画像測定機やレーザ測定器に強みがあります。これら国内メーカーの測定機がエンジン部品の品質検査で広く使われており、精密な寸法保証を支えています。
  • 組付機: エンジン部品やエンジン本体の組立工程では、人手作業を補助・自動化する組付機器やロボットが活躍します。例えば、バルブ組込・スプリング組付けには専用の自動組立機やプレスフィッティング装置が使われ、クランクシャフトやカムシャフトの組込みにはアーム式の搬送ロボットが用いられます。価格相場は装置の複雑さによりますが、産業用ロボットで1台あたり数百万円~数千万円、専用の自動組立ライン一式では億円単位の投資になることもあります。主要メーカーは、自動車業界向けロボットではファナック、安川電機、川崎重工業、不二越などが国内シェアの大半を占めます。組立ライン構築では、平田機工などのシステムインテグレータがこれらロボットと専用機を組み合わせ自動組立設備を供給しています。現代のエンジン工場では、これらメーカーの組付機器による高度な自動化ラインが稼働し、効率的かつ高品質な組立を実現しています。

3. 商社の「当て見積もり」慣習の現状

「当て見積もり」とは、実際には発注しない予定の業者に見積提出だけ依頼し、他社との価格競争を演出する行為を指します。しかし現在のコンプライアンス重視の風潮下では、このような慣習は強く非難され、徐々に廃れつつあります。公正取引や下請法の観点から、見積りは実力ある複数社に公正に依頼すべきであり、発注意思のない当て馬的見積もりは望ましくないとされています。実際、調達ガイドライン等でも「形式だけの相見積もり」は不適切で、サプライヤーとの信頼関係を損ない得ると指摘されています。

そのため、現代では少なくとも建前上、商社による当て見積もり提出の慣習はほとんど残っていないと言えます。万一そのような行為が発覚すれば、独占禁止法上の優越的地位の濫用などコンプライアンス問題に繋がる可能性があり、企業もリスクから敬遠しています。ただし現場レベルでは「参考見積もり」と称して非公式に価格調査を行うケースが皆無とは言えませんが、いずれにせよ現在は表立った当て見積もり慣行は許容されない状況です。

4. 商社におけるトラブル時の責任区分と費用処理の実態

日本の商社では、仕入先メーカーと顧客メーカーの間に立つ仲介者として、取引上のトラブル発生時に責任の所在が不明確になるケースが少なくありません。商社は契約上「売主」として表に立つため、顧客に対してはまず商社が責任を負い迅速に対応するのが一般的です。その上で、仕入先との間で原因や費用負担を交渉し、可能なら補償や値引きを取り付けて自社の損失を回収するという流れになります。

エントリー価格バッファと粗利内原価調整による費用吸収

商社の営業現場では、小~中規模のトラブル費用は 「エントリー価格のバッファ」 や 「粗利内での原価調整」 によって吸収されることが多くあります。エントリー価格のバッファとは、見積もり・仕入時にあらかじめ上乗せした予備原価のことです。例えば仕入先からの実仕入れ値に数%程度の上乗せをして社内原価として登録し、万一のクレーム時にはその部分で損失を賄う仕組みです。このバッファが未使用で済めば追加の利益になりますが、トラブル発生時にはここから値引きや無償対応分を捻出し、顧客対応を円滑に行います。

一方、粗利内での原価調整は、トラブル発生後にその費用相当額を売上総原価に含めてしまう方法です。例えば本来は営業利益となるはずだった部分を削って、問題対応費用に充当します。帳簿上は利益が減るだけで追加の費用科目を立てずに済むため、社内稟議を簡略化できるメリットがあります。ただし大きな損失の場合はこれだけでは吸収しきれないため、別途「クレーム損失引当金」などを計上するケースもあります。実際、大手商社系企業ではクレーム損失引当金を設け、過去のクレーム発生率に基づき当期売上に対して見込み額を積み立てている例があります。このように、平時からリスクに備えたバッファを持たせ、いざという時は営業判断で粗利の中から迅速に費用処理するのが商社実務の特徴です。

ハルシネーション率

結論として、ディープリサーチ機能の回答で、ハルシネーション(誤情報)に該当する回答はありませんでした。

今回は母数がないため明確な比率は出せませんが、GPT-5.2-highのハルシネーション率である10.8%は、現実的な数字であると解釈して良いかと思います。

項2. 取扱メーカー(5社)→主要メーカーへの変換

取扱メーカー(5社)ではなく『主要メーカー』と変換されていましたが、これは誤情報には該当しません。

項3.YesでもNoでもない言い回しができている

ChatGPT-5.2はYesでもNoでもない独特な言い回しができます。

これは実際にその通りで、現在は表立った当て馬の依頼はされませんが、現実では行われることもあります。

最後に

本記事では、ChatGPTのハルシネーション率や、それを避けるためのプロンプトを解説しました。

合わせて読みたい!

参考文献

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次