島根県安来市のフリーランスエンジニア_プログラマー画像1

AIプロンプト評価ツールを作った|4軸スコアリングで改善ポイントを自動提示【デモあり】

「AIに指示したけど思ったのと全然違う結果が出てきた」「Vibe Codingを使ってみたけどうまくいかない」——その原因の多くは、プロンプト(AIへの指示文)の書き方にあります。

今回はプロンプトを入力するだけで4つの評価軸でスコアリングし、具体的な改善ポイントを自動で提示するツールを作りました。自分のプロンプトの弱点を客観的に把握できます。

4つの評価軸

プロンプトの質を左右する要素を4軸で評価します。それぞれ0〜25点の合計100点満点です。

評価軸見ているポイント低スコアの典型例
📌 明確さ何をしてほしいかが一文で伝わるか「ブログ書いて」など動詞が曖昧
🎯 具体性量・形式・条件が指定されているか文字数・出力形式・制約が何もない
📋 文脈背景・目的・読者・役割が含まれているか誰が読むのか・なぜ必要かが不明
⚙️ 構造情報が整理されていて読みやすいか一文に情報が詰め込まれて混乱する

実際に評価してみる(デモ)

自分がよく使うプロンプトを入力して「評価する」を押してください。サンプルボタンで良い例・悪い例の違いを確認するのもおすすめです。

プロンプト評価チェッカー デモ
AIプロンプト評価ツール
入力するだけで4軸スコアリング+改善ポイントを自動提示
評価したいプロンプトを入力
サンプルで試す

※ このデモはルールベースの自動評価です。実際のAI活用・プロンプト設計のご相談はこちらからどうぞ。

スコアが上がるプロンプトの書き方

① 明確さ:「何をしてほしいか」を動詞で明示する

「ブログ記事を書いて」「比較表を作って」「要点を箇条書きでまとめて」のように、やってほしいことを具体的な動詞で伝えます。「〜について教えて」のような曖昧な表現は、AIが回答の形式を勝手に選ぶ原因になります。

② 具体性:数値・形式・制約を追加する

「400字程度」「3点に絞って」「箇条書きで」「専門用語は使わずに」のように、量・形式・制約を言葉や数値で指定します。指定がないとAIが最も答えやすい形を選ぶため、期待通りの出力になりません。

③ 文脈:役割と読者を設定する

「あなたはベテランのWebデザイナーです」のように役割を与え、「WordPressを使ったことがない中小企業の経営者向け」のように読者を指定します。この2つを加えるだけで、難易度・言葉選び・説明の深さが自動的に最適化されます。

④ 構造:情報を整理して渡す

長い指示を一文に詰め込まず、改行・見出しで整理して渡します。

あなたは〇〇の専門家です。

【対象読者】〇〇向け(〇〇の知識なし)
【依頼内容】〇〇を説明する記事を書いてください
【条件】400字程度、専門用語は使わない、結論から書く

ツールの仕組み(技術構成)

今回のプロンプト評価チェッカーは、ルールベースのスコアリングエンジンとJavaScriptのみで構成されており、外部APIへの通信は発生しません。

STEP 1:プロンプトのテキストを解析する

入力されたテキストに対して、評価軸ごとに定義したキーワードリスト・文字数・文章パターンを照合します。役割ワード・数値・改行・制約ワードの有無を検出してスコアを計算します。

STEP 2:4軸でスコアを計算する

各評価軸のスコアを0〜25点で算出し、合計100点満点で総合スコアを計算します。スコアに応じてS・A・B・C・Dのグレードを割り当て、軸ごとにフィードバックコメントを選択します。

STEP 3:改善例を自動生成する

スコアが低い軸に応じて、不足している要素(役割・読者・形式・文字数)を補ったプロンプト例を生成して表示します。

パーツ使用技術役割
テキスト解析JavaScript(独自ロジック)キーワード照合・文字数カウント
スコアリングJavaScript4軸の採点・グレード算出
フィードバック生成JavaScript(条件分岐)スコアに応じたコメント選択
改善例生成JavaScript(テンプレート)不足要素を補ったプロンプト例を出力
フロントエンドHTML / CSS / JavaScriptスコアの可視化・操作UI

よくある質問

どのAIに使えるプロンプトが評価されますか?

ChatGPT・Claude・Geminiなど主要な生成AIへのプロンプトに対応しています。評価軸(明確さ・具体性・文脈・構造)はAIの種類を問わず共通の品質指標です。

スコアが低くても良い出力が出ることはありますか?

あります。シンプルなタスク(「今日の日付を教えて」など)はスコアが低くても問題ありません。このツールはとくに複雑なタスク・長いアウトプットが必要なプロンプトの改善に効果的です。

Vibe Codingでも同じ評価軸が使えますか?

使えます。コードを生成する際も「役割・対象・条件・形式」を明示するほど、生成されるコードの品質が上がります。プロンプト設計はVibe Codingの生産性を左右する最重要スキルです。

まとめ

プロンプトの品質は「役割・読者・形式・構造」の4軸で決まります。デモで自分のプロンプトを評価して、弱い軸を重点的に改善してみてください。

AI活用・業務自動化・Vibe Codingを使ったシステム開発については、お気軽にご相談ください。要件定義からプロンプト設計・実装まで一貫して対応します。

無料相談・お問い合わせはこちら →

AIはなぜ日本が好きなのか?8つの主要LLMを検証した欧州チームの研究が面白い

WordPressセキュリティチェッカーを作った|URLを入力するだけでリスクを自動診断【デモあり】