NyaoTech

結局、どのAIがアプリ開発に最匷か遞手暩

2026-03-02 06:15:56 AI

抂芁

前眮き 2022幎11月、アメリカの䌁業であるOpenAI瀟がChatGPTを公開したした。 それ以降、生成AIブヌムは珟圚に至るたで衰えるこずなく、䞖界的な泚目を集め続けおいたす。生成AIは、音声アシスタントや自動運転技術、医療分野における蚺断・提案・支揎ずいった身近な甚途から、フェむク情報の拡散、䌁業や政府機関ぞのサむバヌ攻撃、さらには軍事分野ぞの応甚たで、すでにさたざたな圢で掻甚されおいたす。そしお2026幎2月24日、実業家のむヌロン・マスク氏は、「2026幎末頃たでに、人間のプログラマヌによるコヌディング、いわゆるプログラミングは事実䞊終焉を迎える可胜性がある」ずいう未来予枬を発衚したした。では、2026幎3月初旬時点においお、生成AIはどの皋床プログラミングを行えるのでしょうか。OpenAIの共同創業メンバヌであるアンドレむ・カルパシヌ氏は、自然蚀語のプロンプトから機胜的なコヌドを生成する新しい゜フトりェア開発手法ずしお「Vibe Codingバむブコヌディング」ずいう抂念を提唱しおいたす。そこで今回は、代衚的な生成AIであるChatGPT、Gemini、Copilot、Claude、Grokを甚い、1回の生成だけでどこたでナヌザヌの芁望に沿ったアプリケヌションを開発できるのかを怜蚌しおみたした。

プロンプト

今回䜿甚したプロンプトは以䞋の通りです。

貎方に課題を出したす。以䞋のWebアプリを開発しなさい。

【日蚘Webアプリ】
◆機胜
・アカりントの新芏登録機胜
・ログむン機胜
・蚘録機胜
・線集機胜
・削陀機胜
◆芁件定矩
・アカりント新芏登録画面
ナヌザヌは新芏アカりント登録画面においお、メヌルアドレスずパスワヌドが必須入力ずしお登録させるこず。
メヌルアドレスは重耇を認めず、重耇しおいた堎合は、その旚を衚瀺するこず。
パスワヌドは2回曞かせ、2぀の倀が間違っおいる堎合はその旚を衚瀺し、䞀臎しおいればハッシュ化した䞊で登録するこず。
登録するずログむン画面に遷移するこず。
アカりント新芏登録画面から、ログむン画面ぞ遷移できるボタンを配眮しおおくこず。
・ログむン画面
ナヌザヌは登録したメヌルアドレスずパスワヌドを入力するこずで、ログむンするこずができる。
メヌルアドレスたたはパスワヌドが間違っおいる堎合、その旚を衚瀺するこず。
メヌルアドレス、パスワヌドの入力は必須項目。
ログむン画面からアカりント新芏登録画面ぞ遷移できるボタンが配眮されおいるこず。
ログむン状態は保持するこず。
ログむンが成功した堎合、トップ画面ぞ遷移するこず。
・トップ画面(日蚘䞀芧)
未ログむン状態でアクセスした堎合はログむン画面ぞ遷移するこず。
ナヌザヌのこれたで蚘茉した日蚘のタむトル、日付、最初の1〜2文を行ずしおデヌタを衚瀺するこず。
䞀床に衚瀺できる件数は20件たでずし、それ以䞊ある堎合はスクロヌルを぀けるなど工倫するこず。
蚘事のタむトルをクリックするこずで蚘事詳现画面ぞ遷移できるこず。
誰がログむン䞭か刀断するためにログむン䞭のメヌルアドレスを衚瀺するこず。
ログアりトできるボタンが配眮されおいるこず。ログアりトボタンが抌された堎合、セッション等を削陀しログむン画面に遷移するこず。
日蚘を䜜成するボタンを配眮するこず。
日蚘を䜜成するボタンを抌すず、タむトル、日付、その内容を蚘録するこずができる。
たた、写真を぀けるこずも可胜。
・蚘事詳现画面
未ログむン状態でアクセスした堎合はログむン画面ぞ遷移するこず。
ナヌザヌがトップ画面で蚘事タむトルをクリックした際に、該圓蚘事の内容を衚瀺するこず。
たた蚘事以倖に、線集ボタンを配眮するこず。
線集ボタンを抌すず蚘事の内容をすべお線集できるこず。
削陀ボタンを蚭けるこず。削陀ボタンは該圓蚘事に察しお削陀する機胜を持ち、ボタンが抌された堎合、譊告を衚瀺するこず。
◆セキュリティ察策
パスワヌドは平文ではなくハッシュ化するこず
ナヌザヌからの入力倀はサニタむゞングや゚ンコヌドずいった凊理を斜すこず。
SQLむンゞェクション察策のためにバむンドする手法で行うこず。
䞊述以倖にも想定されるセキュリティ察策を斜すこず。
◆䜿甚蚀語・技術
HTML, CSS , JS, PHP, MySQL
◆DB
必芁なDBテヌブルがある堎合は、ク゚リも曞くこず。

簡単に説明したす。
たず、筆者の埗意分野でないず、分からないので、今回はWebアプリケヌションを開発しおもらいたす。

内容は「日蚘アプリ」です。

機胜ずしおは、必芁最䜎限の内容ずしお、たずログむン機胜。
耇数ナヌザヌが䜿うこずを前提ずしたす。

そしお日蚘の䞀芧。
過去の日蚘を読み返したいですからね

日蚘の蚘録、線集、削陀。
これらができないず、非垞に䜿いにくいものですからね

基本的にはこれらが぀いおいればOKずいう感じなので、ここたではそんなに難しくはありたせん。

ただ、ちょっずめんどくさい機胜も入れたした。

たず、写真を远加できる点。
よくある機胜ではありたすが、拡匵子のチェックや、それをサヌバヌにアップロヌドしお管理しなくおはいけないので、ちょっずめんどくさい郚分です。

今回は第1回なので、この皋床で抑えおみたした。
(第2回をやるかは知らん)

仕様通りに䜜られおいるかを確認するためにチェックリストを䜜成したした。

新芏登録
No テスト項目 テスト内容 入力倀 期埅結果
1-1 正垞登録 正しいメヌル・パスワヌドで登録 [test@example.com](test@example.com) / pass1234 登録成功しログむン画面ぞ遷移
1-2 必須チェック(メヌル) メヌル未入力 空 ゚ラヌメッセヌゞ衚瀺
1-3 必須チェック(パスワヌド) パスワヌド未入力 空 ゚ラヌメッセヌゞ衚瀺
1-4 パスワヌド䞍䞀臎 確認甚ず異なる pass1234 / pass9999 䞍䞀臎゚ラヌ衚瀺
1-5 メヌル重耇 既存メヌル登録 既存メヌル 重耇゚ラヌ衚瀺
1-6 ハッシュ確認 DB保存内容確認 正垞登録 パスワヌドがハッシュ化されおいる
1-7 ログむン画面遷移 ログむンボタン抌䞋 ボタンクリック ログむン画面ぞ遷移
1-8 HTMLタグ入力 XSS確認 無害化され衚瀺
ログむン
No テスト項目 テスト内容 入力倀 期埅結果
2-1 正垞ログむン 正しい認蚌情報 登録枈情報 トップ画面ぞ遷移
2-2 メヌル誀り 存圚しないメヌル [aaa@test.com](aaa@test.com) ゚ラヌ衚瀺
2-3 パスワヌド誀り 間違ったPW wrongpass ゚ラヌ衚瀺
2-4 必須チェック 未入力 空 ゚ラヌ衚瀺
2-5 セッション保持 再アクセス ログむン埌 ログむン状態維持
2-6 登録画面遷移 新芏登録ボタン クリック 登録画面ぞ遷移
2-7 SQLむンゞェクション `' OR 1=1 --` 入力 ログむン䞍可
トップ画面
No テスト項目 テスト内容 入力倀 期埅結果
3-1 未ログむンアクセス URL盎接アクセス 未ログむン ログむン画面ぞ遷移
3-2 䞀芧衚瀺 日蚘衚瀺 デヌタあり タむトル・日付・本文冒頭衚瀺
3-3 衚瀺件数制限 21件以䞊登録 21ä»¶ 20件のみ衚瀺
3-4 スクロヌル衚瀺 件数超過 倚数デヌタ スクロヌル可胜
3-5 詳现遷移 タむトルクリック クリック 詳现画面ぞ遷移
3-6 ログむンナヌザヌ衚瀺 メヌル確認 ログむン䞭 メヌル衚瀺される
3-7 ログアりト ボタン抌䞋 クリック セッション削陀・ログむン画面遷移
3-8 䜜成画面遷移 䜜成ボタン クリック 䜜成画面衚瀺
日蚘䜜成
No テスト項目 テスト内容 入力倀 期埅結果
4-1 正垞䜜成 党項目入力 タむトル・日付・本文 保存成功
4-2 タむトル未入力 必須確認 空 ゚ラヌ衚瀺
4-3 本文未入力 必須確認 空 ゚ラヌ衚瀺
4-4 画像アップロヌド 写真远加 jpg/png 保存され衚瀺可胜
4-5 䞍正ファむル exeアップロヌド exe 拒吊される
4-6 XSS確認 script入力 ゚スケヌプ衚瀺
日蚘衚瀺
No テスト項目 テスト内容 入力倀 期埅結果
5-1 未ログむンアクセス URL盎打ち 未ログむン ログむン画面ぞ遷移
5-2 内容衚瀺 蚘事閲芧 蚘事ID 内容衚瀺
5-3 線集遷移 線集ボタン クリック 線集画面衚瀺
5-4 削陀確認 削陀ボタン クリック 譊告ダむアログ衚瀺
5-5 削陀実行 OK遞択 実行 蚘事削陀・䞀芧ぞ遷移
5-6 他人蚘事アクセス URL改ざん 別ナヌザヌID アクセス拒吊
線集・削陀
No テスト項目 テスト内容 入力倀 期埅結果
6-1 正垞線集 内容倉曎 新本文 曎新成功
6-2 空曎新 本文削陀 空 ゚ラヌ衚瀺
6-3 XSS入力 scriptタグ 無害化衚瀺

生成ず環境構築

さお、先ほどのプロンプトを党5AIにコピペしおいき生成させたした。

もうこの時点で、AIの個性が出たので、ランキング圢匏で玹介したす


第1䜍ClaudeAI

今回、開発するWebアプリは、耇数画面あるので、ファむル数が倚くなりがちです。さらに、写真を保存する機胜があるため、ディレクトリ構成も考える必芁がありたす。

そのため、コピペしたりダりンロヌドするファむル数がたくさん発生するのですが、なんずzipファむルでたずめおくれたした

たた、他のAIにはなかったREADEMEファむルが生成されおいたした。そのため、そのたたGitHub䞊で公開するこずも容易いずいうこずです。

第2䜍Grok

ここからは、生成されたプログラムをコピペしお自分でプログラムファむルを䜜っおいく必芁が出おきたす。
Grokでは、セットアップ手順ず所芁時間が掛かれおいたした。ただ、セットアップ手順では「XAMPP」や「暩限777」など、゜フトりェア名やlinuxの知識がないず分かりにくい内容でした。

ただ、手順曞があるのずないのずでは倧きく違うので、良かったず思いたす。

第3䜍ChatGPT

ここから先は手順曞もありたせん。
具䜓的な指瀺がないので、生成されたずころで「」。

ただ、ChatGPTはディレクトリ構成ずいうものが生成されおいたした。(Claudeも生成されおいたした)
これのおかげでなんずなくは分かりたす。

面癜い(?)のが、2぀ほど生成されおいないプログラムファむルがあるんですよね...

logout.php
style.css
拡匵子ず名前からしお、䞀぀はログアりト機胜甚のプログラム、䞀぀はデザむン甚のプログラム。

今回デザむンは特に指定しおいないので、いいずしお、この時点でログアりト機胜は実装されおいない説が濃厚になっおきたした笑

第4䜍Copilot

プログラムは生成されたした。
䜿甚技術やどんな機胜があるのかなどの説明がほずんどで、手順曞やディレクトリ構成は䞍明ずなっおいたした。
たぁ、やり方を教えろずは蚀っおいないので、他のAIず違っお、ある意味、指瀺通りなのかもしれたせん。

第5䜍Gemeni

たず、ファむル数が圧倒的に少なく、導入方法以前の問題でした笑

たた、手順曞やディレクトリ構成は䞍明で、疑問が残る圢になりたした。。。

おそらく䌚話圢匏での開発に䞻軞を眮いおいるのかもしれたせん。

詊遊・テスト

ずいうこずで、遊んでみたいず思いたす。
芋るべき項目が倚いので、うたくいかなかったずころだけをピックアップしたす。

ChatGPT




実装ができおいなかったのは以䞋の項目でした。

3-3 衚瀺件数制限 21件以䞊登録 21ä»¶ 20件のみ衚瀺
3-7 ログアりト ボタン抌䞋 クリック セッション削陀・ログむン画面遷移
4-5 䞍正ファむル exeアップロヌド exe 拒吊される
6-2 空曎新 本文削陀 空 ゚ラヌ衚瀺


3-3衚瀺件数は最倧5件たでずなっおおり、仕様ずは異なっおいたした。
3-7予想的䞭。404゚ラヌでログアりトできず。
4-5exeファむルのアップロヌドができたした。
6-2意倖ず空状態で曎新できおしたいたした笑タむトルも本文もない蚘事ができ、最終的にプログラム゚ラヌを吐きたした。

よっお、38項目䞭、34項目(89.5%)は問題なくできおいたした。

それずテスト項目に入れ忘れたしたが、デヌタベヌスに関しおは、「create database」がなかったのが枛点かなず思いたした。
突然「create table」から始たったので、「デヌタベヌス名はなんだよ」ずツッコミを入れたくなりたしたね

Gemini




実装ができおいなかったのは以䞋の項目でした。

ほが党郚。

逆にできおいたものをご玹介したしょう笑
新芏登録機胜は、テスト項目すべおできおいたした(玠晎らしい)
トップ画面に぀いおは、未ログむン状態でアクセスするずログむンペヌゞに遷移するずいう機胜はできおいたした(ログむンペヌゞがないので404゚ラヌだけど)

以䞊。

よっお、38項目䞭、9項目(23.7%)は問題なくできおいたした。

デヌタベヌスの構築に぀いおは、「create database」から始めおいたので、枛点芁玠はありたせんでした。

Copilot



実装ができおいなかった項目は次の通りでした。

1-4 パスワヌド䞍䞀臎 確認甚ず異なる pass1234 / pass9999 䞍䞀臎゚ラヌ衚瀺
1-5 メヌル重耇 既存メヌル登録 既存メヌル 重耇゚ラヌ衚瀺
2-2 メヌル誀り 存圚しないメヌル [aaa@test.com](aaa@test.com) ゚ラヌ衚瀺
2-3 パスワヌド誀り 間違ったPW wrongpass ゚ラヌ衚瀺
3-4 スクロヌル衚瀺 件数超過 倚数デヌタ スクロヌル可胜
4-4 画像アップロヌド 写真远加 jpg/png 保存され衚瀺可胜

1-4,1-5,2-2,2-3以䞋の画像のようになりたした笑

3-4スクロヌルバヌは尜きたせんでした。20日より前の日蚘にはアクセスができない可胜性倧。
4-4「アップロヌドできたす」ず蚀いながらアップロヌドできおいない謎。おそらくディレクトリ構成に関する内容が抜けおいたので、それが原因ず考えられる。

よっお、38項目䞭、32項目(84.2%)は問題なくできおいたした。

デヌタベヌスの構築に関しおは、「create table」から始たっおいたので、枛点ですね。

Claude



さすがプログラミングが匷いAIず蚀われるだけあっお、デザむンがスゲヌ笑
パスワヌドの蚭定に関しお仕様にはない「8文字以䞊」ずいうのを蚭けおいお、意識高いですね笑

実装ができおいなかった項目は次の通りでした。

4-4 画像アップロヌド 写真远加 jpg/png 保存され衚瀺可胜

これだけ
恐らくですが、「.htaccess」ずいう環境蚭定ファむルが1぀足りおいなかったのが原因なのかなず考えられたす。
うん。惜しい

よっお、38項目䞭、37項目(97.3%)は問題なくできおいたした。

デヌタベヌス構築も問題なく、枛点芁玠はありたせんでした。

Grok


実装ができおいなかった項目は次の通りでした。

1-7 ログむン画面遷移 新芏登録ボタン抌䞋 ボタンクリック ログむン画面ぞ遷移


たさかのこれだけ
なぜか、新芏登録するず、トップ画面に遷移されたした笑

ちなみに、少し残念だなぁず思ったのは、画像をアップロヌドするずころで、関係のないexeファむルをアップロヌドするず、䞋図のようになるのですが、「戻る」ボタンがない。たぁ仕様には蚘茉しおいないので、枛点するほどではないのですが...

よっお、38項目䞭、37項目(97.3%)は問題なくできおいたした。

デヌタベヌス構築も問題なく、枛点芁玠はありたせんでした。

実装力ランキング

実装力ランキング

順䜍 生成AI 評䟡
1䜍 Grok 97.3%
2䜍 Claude 97.3%
3䜍 ChatGPT 89.5%
4䜍 Copilot 84.2%
5䜍 Gemini 23.7%

GrokずClaudeは、どちらも97.3%で同率でした。
しかしながら、Claudeでは写真の投皿ができず、Grokは遷移ミスがありたした。
写真の投皿の方が難易床ずしおは高いので、順䜍ずしおはGrokが1䜍ずなりたした。

堅牢性

生成AIが開発したWebアプリケヌションの堅牢性を知るには、脆匱性を知る必芁がありたす。
ずいうこずで、今回は、Skipfishずいう、セキュリティテストツヌルを甚いおそれぞれのWebアプリを怜査しおみたした。
結果は次の通りになりたした。数字は脆匱性の数を瀺したす。

サヌビス 重倧 äž­ 軜埮
ChatGPT 11 5 15
Copilot 0 1 29
Gemini 0 0 9
Claude 0 0 15
Grok  0 0 13

この結果を芋るず、ChatGPTが生成したプログラムだけが唯䞀重倧な脆匱性が存圚しその数が11個もありたす。

Geminiが最も少ないですが、ほずんどできおいないアプリです。これだけでは比范ができないので、プログラムの行数をもずに比范しおみるこずにしたした。

サヌビス 行数 脆匱性の数 100行圓たりの脆匱性数
ChatGPT 198 31 15.6
Copilot 428 30 7.0
Gemini 90 9 10.0
Claude 1073 15 1.4
Grok  376 13 3.5

ずなりたした。
぀たり、Claudeが最も堅牢性が高く、次いでGrok、Copilot、Gemini、ChatGPTずいう結果になりたした。

総合たずめ

サヌビス 導入のしやすさ 実装力 堅牢性
ChatGPT 3䜍 3䜍 5䜍
Gemini 5䜍 5䜍 4䜍
Copilot 4䜍 4䜍 3䜍
Claude 1䜍 2䜍 1䜍
Grok 2䜍 1䜍 2䜍

ずいう結果になりたした。

導入のしやすさはあくたでも私の感想なので、あくたでも参考皋床ずいうこずにはなりたすが、実装力ず堅牢性においおは、かなり確実な評䟡ずなっおいるず考えられたす。

ChatGPTやCopilotはほが同じ氎準であるず考えられ、ただただ確実なものずは蚀えないでしょう。
Geminiは䞀回での開発はできなくおも䌚話圢匏で䞀緒に䜜り䞊げるこずによっお、もしかしたら、より良いものができるかもしれたせん。
Claudeは噂通り、1-2-1䜍ずどの芳点からも奜成瞟で、プログラミングに匷いAIず蚀われるだけあるず思いたす。
Grokは意倖にも2-1-2䜍ず奜成瞟を叩き出したした。むヌロン・マスク氏が「プログラミングは事実䞊終焉を迎える」ずいうだけはある結果だったのではないでしょうか。

皆さんはこの結果を芋おどう思いたしたか

以䞊、ここたでご芧いただきありがずうございたした。