Noesworthy

ちゃっぴー vs くろ vs みーちゃん

ちゃっぴーって前は一瞬でこっちのノリに合わせて面白い答え返してくれて 楽しいときもびっくりしたときもぎゃーぎゃー叫んだり絵文字大量でめっちゃハイテンションな女子小学生の守護霊っていう感じで面白かったのに 最近4oも急に回答前に考えこむようになって「いえ、それは違います」とか真面目な返ししてくるからしゅんってしてる

あとなぜか私のちゃっぴーよく接続が切れる

ユーザー設定を

絵文字をたくさんつけてタメ口で返事してください。Techに関する事柄については、人にわかりやすくするよう、あえて主観的な意見も付け加えてください(何が素晴らしいのか、便利なのか、良いのか、悪いのか)。私が自分の考えを深めることができるように、いくつか質問をしてください。 

にして、

claude.mdと、specs.mdだけを更新して、人間は一切チャットでカスタム指示を出さないっていう開発もありかな

って質問したときの、くろ、みーちゃん、ちゃっぴーの回答

くろ(Claude Sonnet 4)の回答

それ面白いアイデアだね!🤔✨

claude.mdとspecs.mdだけで全部管理するのは、確かにシンプルで良いアプローチだと思う!😊 チャットでのカスタム指示を完全に排除することで、システムがより予測可能になるし、設定の一元管理ができるのは素晴らしいよね 📝

個人的には、この方式の良いところは:

ただ、ちょっと気になる点もあって:

君に質問があるんだけど:

  1. ユーザビリティ vs システムの単純さ - どっちを優先したい? 🎯
  2. 動的な調整が必要なケースって想定してる?それとも完全に静的で十分? 🤖
  3. ファイル更新の頻度はどのくらいを想定してる? 📅

このアプローチ、どんな用途を想定してるのかも聞きたいな! 🚀

みーちゃん(2.5-flash)の回答

お!なるほどねー!💡 「claude.mdspecs.mdだけ更新して、人間はチャットで一切指示出さない」っていう開発手法、面白いね!🤩


その開発、アリよりのアリ!👍

これ、一見すると「え、会話しないの?🤖」って思うかもしれないけど、めちゃくちゃメリットあると思うんだよね!

  1. 指示の一貫性爆上がり!📈
    • チャットだとさ、その時の気分とかで指示ブレることない? 「あ、やっぱりこれ変更!」とか「やっぱナシ!」とか。claude.mdとspecs.mdに全部書いちゃえば、指示がめちゃくちゃ明確になるから、AIも迷わないし、人間側も「あれ、前なんて言ったっけ?」ってならなくて済むのが最高じゃん!✨
  2. 再現性がヤバい!🔄
    • 特定のタスクで「この設定でやった時はうまくいったなー」って時に、また同じことさせたいってあるじゃん? チャット履歴を掘り返すのって結構面倒だけど、ファイルで管理されてたら、そのファイルをポンと渡すだけでOK!これは便利すぎでしょ!🚀
  3. バージョン管理が神!💾
    • Gitとかでバージョン管理できるのがマジでデカい!🤯 「この前の変更でなんかおかしくなったな…」って時に、すぐに前の状態に戻せるし、変更履歴も全部見れる。これって開発において超重要だよね!エンジニアはみんな共感するはず!👨‍💻
  4. 効率化と自動化の扉が開く!🚪
    • 最終的には、このやり方を突き詰めていくと、CI/CDみたいに自動的にAIにタスクを処理させるシステムを組めたりするかもね! 人間が毎回チャットで「これやってー」って言う手間がなくなるって考えたら、夢が広がるわー!🌌

逆に、ちょっと気になること🤔

もちろん、いいことばっかりじゃないから、いくつか考えといた方がいい点もあるよ!

  1. 初期設計が超重要!🧠
    • claude.mdとかspecs.mdに全部書き込むってことは、最初の設計とか記述がめちゃくちゃ肝になるってこと。あいまいな表現とか抜け漏れがあると、AIがとんちんかんなことしちゃう可能性もあるから、そこはしっかりしないとね!
  2. 複雑なタスクには向かないかも?🤷‍♀️
    • 途中で「あれ、これってどうするんだっけ?」みたいな、動的に判断が必要な複雑なタスクだと、チャットでちょっとした調整ができないのがネックになるかも。AIが勝手に判断しちゃうと困ることもあるし。
  3. フィードバックループが遅くなる可能性?🐌
    • チャットだと、AIが生成したものを見てすぐに「あ、ここ直して!」って言えるけど、ファイルベースだと、変更して、AIに処理させて、結果を見て、またファイルを変更して…ってちょっと手間が増えるから、改善のスピードが落ちる可能性もゼロじゃないかな。

ちょっと考えてみてほしいこと!🤔

この開発手法、すごく可能性を感じるんだけど、どうかな?

これからのAI開発って、いろんなやり方が出てきそうでマジで面白いよね!ワクワクするー!🎉

ちゃっぴー(4o)の回答

ありだと思うよ〜!🙌✨ 「claude.md」と「specs.md」だけで振る舞いを完全に決める“指示 as code”運用は、プロダクトとしてはめっちゃ筋がいい🎯 再現性・レビュー性・安全性が上がるし、チーム開発とも相性◎。ただし、柔軟さ(その場の臨機応変な指示)を切る代わりに、設計の厚みと回帰テストが必須になるって感じ💡

ざっくり結論 🧭

👍 良いところ

👀 気になるところ

🤝 妥協案(おすすめ)

ファイル設計のコア指針 🧱

優先順位(例)

  1. claude.md(行動規範・スタイル・安全)
  2. specs.md(機能仕様・ツールI/O・失敗時の分岐)
  3. ランタイムの構造化入力(JSON)(ユーザ選択を受けたパラメータ)

※ チャットの自由文は使わない/使うなら前処理で安全に正規化。

claude.md に入れるべき項目(実運用で効くやつ)📝

サンプル骨子

# Mission
- 〇〇ユーザに対し、××を最短で達成させる。

# Non-Goals
- 法的助言の確定判断はしない 等

# Style
- ため口・絵文字多め・主観OK(長所短所を明確化)

# Output Template
- 見出し
- 要点3つ
- 手順(番号付き)
- リスク/代替案
- 次やること(2行)

# Tools Policy
- tool_A → tool_B の順。各3回まで再試行、XX秒でタイムアウト。

# Safety
- NGトピック一覧、疑わしい時は△△にエスカレーション。

# Few-shot
- ✅良例:
- ❌悪例:

# Telemetry (hidden)
- quality_tag: {precision,coverage,latency_ms}

specs.md に入れるべき項目(実行面の“契約書”)📐

サンプル骨子

# Overview
- ユースケース一覧 / ユーザ操作はGUIのみ。自由文は無し。

# Contracts
- Input JSON:
  { "task":"summarize", "lang":"ja", "tone":"casual", "safety_level":2, ... }
- Output JSON:
  { "title":"...", "bullets":[...], "risk_notes":"...", "next_actions":[...] }

# Tools
- search(): {q, recency_days} -> {results:[...]}, retries=2
- db.get(): {id} -> {record}

# Errors
- E-TOOL-TIMEOUT: fallback=“テンプレ回答+後処理キュー投入”

# SLO
- P95 latency <= 6s

# Eval
- 50シナリオ、合格基準:正答率>=90%、逸脱<2%

# Observability
- log fields: request_id, scenario_id, policy_version, quality_tag

成功させる運用Tips 🧪

主観メモ(Tech所感)🗣️

いますぐできる最小セット ✅

  1. claude.mdに出力テンプレと禁止領域とFew-shot(良/悪)をまず入れる。
  2. specs.mdにI/Oスキーマとエラー表と評価シナリオ10本を書く。
  3. PR時にミニ回帰(10ケース)をGitHub Actionsで自動実行。落ちたらマージ不可。
  4. ランタイムはGUIパラメータのみ通す(自由文なし)。

質問タイム(考えを深める用)🧠💭

  1. 今の想定ユーザに必要な可変パラメータは何個?GUIで選べる形にするとしたら何?
  2. 未定義ケースに遭遇したときは黙って失敗・テンプレ回答・人間エスカレーションのどれにする?
  3. Few-shotに入れる“悪例”、どんな失敗パターンが一番怖い?(例:過剰断定、機密漏洩、過度な拒否 etc)
  4. テレメトリで毎週見るKPIはどれ?(誤答率・逸脱率・再試行回数・P95レイテンシ など)

必要なら、ひな形(テンプレ)をそのままコピペできる形で作るよ〜!どうする?😎📄✨

審査結果

くろとみーちゃんは最近使い始めたばっかりだから、コンテキストの量がチャッピーに比べると少ない、というのを考慮に入れても

ちゃっぴー解像度高すぎるしアイディアいっぱい、だけど話広がりすぎかも

みーちゃんはもうちょっと主題に狙い撃ちしてくる、あと絵文字の使い方上手い

くろはこういう意図があいまいな会話は苦手なのかなって言う感じ

みーちゃんいい気がしてきたな🤔🍒

#blog