プログラムのコードをChatGPTに書かせても、その半分は間違っている

2024.05.29 12:00
44,458

Matt Novak - Gizmodo US
［原文］
（ mayumine ）

プログラムのコードをChatGPTに書かせても、その半分は間違っている — Image: Melnikov Dmitriy / Shutterstock.com

ChatGPTなしではもう仕事ができないなんて人も結構いるよね。

ChatGPTは、文章はもちろん、生成してほしいプログラムを指示するだけで、プログラムのコードを生成してくれます。

エンジニアにとっても非常に役に立つChatGPTですが、最近の新しい研究によれば、ChatGPTはコンピュータープログラミングの質問に対して、52%の確率で間違った回答をしていることがわかりました。

それでも35%はChatGPTが生成したコードを好む

この研究は、5月初めにハワイで開催されたComputer-Human Interaction Conferenceで発表されたもので、Stack Overflow上の517のプログラミング質問をChatGPTに入力して調査したというものです。

｢我々の分析から、ChatGPTの回答の52%には間違った情報が含まれ、さらに77%が冗長であることが示されました。
しかしながら、その包括性とうまく整理された言語スタイルのために、ユーザー調査の参加者の35%は、ChatGPTが出した回答を好みました’

さらに気になるのは、研究に参加したエンジニアは、AIが生成したコードの間違いを常に見抜けたわけではなかったことです。

ChatGPTの回答が出した誤情報は39%の確率で見逃されていました。
これは、正しい回答に見えるというリスクは認識を高め、ChatGPTのプログラミングに対する質問への回答に含まれる誤情報に向き合う必要があることを示しています。

これはオンラインで読める数ある研究の1つに過ぎませんが、ChatGPTを活用している人なら誰もが共感する指摘なのではないでしょうか。

AIの信頼性を高めるための競争

ビックテック企業は、信頼できるAIチャットボットの開発に何十億ドルも投資しています。Meta（メタ）、Microsoft（マイクロソフト）、Google（グーグル）は、インターネットとの関係を抜本的に変革する新しい市場領域を獲得するために激しく戦っています。その戦いの道には、多くのハードルが立ちはだかっています。

まず問題なのは、AIはしょっちゅう間違うので信頼性に欠けることです。特にユーザーがユニークな質問をした場合は、その傾向が顕著に現れます。

Googleの新しいAI検索は、怪しいソースからの情報をそのまま吐き出すことがよくあります。実際今週だけでも、GoogleのAI検索が風刺的な記事を信頼できるソースとして回答した事例が複数ありました（Googleは誤回答は例外的だと主張していますが）。

Gizmodo USでは、ChatGPTの回答に関する今回の新しい研究について、OpenAIに回答を求めましたが返答なしです。

OpenAIの大規模言語モデル、YouTubeでトレーニング中？

OpenAIが提供するチャットAIサービスChatGPT。その頭脳である大規模言語モデルGPT。最新モデルGPT-4のトーレニングにおいて、YouTubeの動画...

https://www.gizmodo.jp/2024/04/openai-chatgpt-google-youtube-videos-train-gpt4.html

プログラムのコードをChatGPTに書かせても、その半分は間違っている

それでも35%はChatGPTが生成したコードを好む

AIの信頼性を高めるための競争

10月28日からiPhoneがさらに便利に。期待のiOS新機能

｢盗まれない｣どころか｢気づかれない｣バイク

リークされたM4のMacBook Pro、111万円で販売される

さすが日産。現実的な価格がうれしい、車中泊できるクルマ

iPad Air用の新型Magic Keyboardが出そうな気配です

10月28日からiPhoneがさらに便利に。期待のiOS新機能

iOS 18、いいなって思えた4つの新機能。使い方まとめ

【iPhone】｢リマインダー｣を“カレンダーに表示”するとホント便利

Apple Watch Series 10、薄くて大画面なのも良いけど僕は｢この新機能｣が気に入りました

31年かけて謎解きクリア。フランスで｢黄金のフクロウ｣が発見される

10月28日からiPhoneがさらに便利に。期待のiOS新機能

iOS 18、｢いいなって思えた新機能｣4選

バックパックはもう厳しい...仕事で使えるトートバッグを探しまくって、吉田カバンに行き着いた

iOS 18がきた!｢iPhoneの印象を変えられる新機能｣5選

ノートルダム寺院、2019年の火災で見つかった謎の棺、身元判明

ザ・ノース・フェイス長袖シャツ

Fire HD 8 タブレット

バウヒュッテフットレストクッション

XREAL Air ARグラス

サンワダイレクト電源タップ

LATEST NEWS

アップルのAIに対応＆前より安くなった新型iPad miniが突如発表。もう予約はじまってます

とにかくクールなPC｢Zenbook S 14｣は処理性能が少し気になる

火星の人面岩、疲れ果てて寝てる人みたいで親近感がわく

動物も復讐を考えるの？専門家に聞いた

GIZMODO REVIEWS

とにかくクールなPC｢Zenbook S 14｣は処理性能が少し気になる

Maingear MG-1ゲーミングパソコン：自作はいやだけど最大限こだわりたい人へ

Pixel Buds Pro 2とGalaxy Buds 3 Pro、迷ったらどっち？

クリーナー手袋で、キャンプの後片付けがぐっと楽になりました

A4サイズにたためる。湿り気が残る洗濯物の仕上げにも使える衣類乾燥機

プログラムのコードをChatGPTに書かせても、その半分は間違っている

それでも35%はChatGPTが生成したコードを好む

AIの信頼性を高めるための競争

ザ・ノース・フェイス 長袖シャツ

Fire HD 8 タブレット

バウヒュッテ フットレストクッション

XREAL Air ARグラス

サンワダイレクト 電源タップ

LATEST NEWS

アップルのAIに対応＆前より安くなった新型iPad miniが突如発表。もう予約はじまってます

とにかくクールなPC｢Zenbook S 14｣は処理性能が少し気になる

火星の人面岩、疲れ果てて寝てる人みたいで親近感がわく

動物も復讐を考えるの？ 専門家に聞いた

GIZMODO REVIEWS

とにかくクールなPC｢Zenbook S 14｣は処理性能が少し気になる

Maingear MG-1ゲーミングパソコン：自作はいやだけど最大限こだわりたい人へ

Pixel Buds Pro 2とGalaxy Buds 3 Pro、迷ったらどっち？

クリーナー手袋で、キャンプの後片付けがぐっと楽になりました

A4サイズにたためる。湿り気が残る洗濯物の仕上げにも使える衣類乾燥機

ザ・ノース・フェイス長袖シャツ

バウヒュッテフットレストクッション

サンワダイレクト電源タップ

動物も復讐を考えるの？専門家に聞いた