GitHub15万スターのAI開発自動化リポジトリをプロが徹底検証

— 340件の修正履歴が教えてくれた「本当に効くルール」の作り方 —

はじめに

先日、X（旧Twitter）で大きな話題になっteiru投稿があります。

「Google歴11年のエンジニアがClaude Codeで業務の80%を自動化。1日2〜3時間の勤務で月$28,000の収入」

この投稿で紹介されていたのが、GitHubで15万スター以上を獲得しているリポジトリ「Everything Claude Code（以下ECC）」です。

47の専門AIエージェント、181のスキル、79のコマンド——これだけ聞くと「導入すれば全部解決するのでは？」と思いますよね。

私も最初はそう思いました。

しかし、実際にClaude Codeを使ってこのリポジトリを徹底分析したところ、意外な結果が出ました。

株式会社IIWAYO.TECHの代表として「BANSOU CTO™」（伴走型フラクショナルCTOサービス）を運営し、独自のAI開発手法「Flow Coding」を構築してきた立場から、率直に比較レポートをお伝えします。

まず、記事の主張を検証してみた

話題の投稿には、いくつかのインパクトのある数値が並んでいました。一つずつ検証します。

「153K+スター」 → 事実。実際にはさらに多い157K+。ここは正確です。

「30+エージェント / 180+スキル」 → むしろ控えめ。実際は47エージェント・181スキルとさらに充実。

ここまでは記事の信憑性を裏付ける結果。しかし、問題はここからでした。

「コンベンション違反率40%→3%」 → 定量的な根拠がありません。どのプロジェクトで、どういう基準で、どう測定したのか一切不明。

「AgentShield 1,282テスト」 → リポジトリ内にAgentShieldのディレクトリが見当たりません。別リポジトリとして存在はしますが、「内蔵」という記事の表現は正確ではありません。

「v2.1.100のトークン水増し問題」 → Claude Codeは「根拠なしの陰謀論」と判定。サーバー側の処理変更をトークン窃盗と結びつける論理に裏付けがありません。

「Karpathyとの関連」 → Karpathy氏本人が作ったものではなく、同氏の発言を元に第三者が作成したルールファイル。権威の借用です。

結論として、リポジトリ自体は高品質。でも、記事のマーケティングが相当に誇大だったということです。

ECCの中身は実際どうなのか

誤解しないでいただきたいのですが、ECCリポジトリそのものは非常によくできています。

1,318コミット、170人以上のコントリビューター、Anthropicハッカソン受賞という実績。Claude Code、Cursor、Codex、OpenCodeなど主要AIツール全てに対応するクロスプラットフォーム設計。MITライセンスでオープンソース。

特に優れていると感じた点は2つあります。

1つ目はHooks（実行タイミングの自動化）。コードを編集した後に自動でチェックが走る、git push前にビルド確認が入る、といった仕組みです。ルールを「書いておく」だけでなく「自動で発動させる」という考え方は、人間の注意力に依存しない品質管理を実現します。

2つ目は自律実行の安全制御。AIが暴走しないためのループ安全ゲート（同一エラー3回で停止、1ラウンド20ファイル上限など）は、実運用では極めて重要です。

では、なぜ「自社ルールの方が上」と言えるのか

ここからが本題です。

私のFlow Codingでは、claude.aiで設計→Lovableで実装→Claude Codeで検証、という3段階パイプラインの中で、340件以上の修正履歴から帰納的にルールを構築してきました。

Claude Codeにこの2つのシステムを比較分析させた結果、明確な差が出ました。

自社の方が優れていた点

チェックコマンド体系の精度。

私のシステムでは、A〜Iのパターン分類による19種のチェックコマンドを持っています。「過去にこう壊れたから、こう防ぐ」という実証データに基づくルールです。

ECCのルールは「こうすべき」という演繹的な理想論。私のルールは「こう壊れた」という帰納的な事実。この差は、実際にプロジェクトを動かしたときに如実に現れます。

Supabase/RLS特化ルール。

ECCにはPostgreSQLの汎用パターンはあります。しかし、Lovable + Supabase構成で実際に発生するRLSの落とし穴——たとえば匿名ユーザーのアクセス制御やEdge FunctionでのSERVICE_ROLE_KEY使用時の注意点——に特化したルールはありません。

私のルールは、実際にRLSの設定ミスでヒヤリとした経験から作られています。

340件の修正履歴に基づく実証。

ECCの181スキルは「理論から導いた正解」。私の19チェックコマンドは「340回の失敗から蒸留した正解」。どちらが現場で効くかは、システム開発の経験者なら直感的にわかるはずです。

ECCの方が優れていた点

先述の通り、Hooks（自動実行の仕組み）と安全制御（ループ防止）。

これは「ルールの質」の問題ではなく「ルールをいつ・どう発動させるか」の仕組みの話です。ここはECCに学ぶべき点があると素直に認め、自社のシステムにも取り入れました。

具体的には、Edit/Write後の300行超過自動検出、確信度閾値（CRITICAL 90%/HIGH 80%/MEDIUM 70%）の導入、同一エラー3回で停止するループ安全ゲート。これらをECCの思想を参考に、自社のルール体系に統合しています。

「有名なツールを入れれば解決」という幻想

この比較を通じて改めて確信したことがあります。

AIツールの世界では、「15万スターのリポジトリを入れれば開発が自動化される」「このプロンプト集を使えば品質が上がる」といった話が溢れています。しかし、現実はそう単純ではありません。

ECCのREADME自体が警告していますが、全コンポーネントを入れるとClaude Codeの200Kコンテキストウィンドウが70Kまで縮小します。つまり、「全部入り」にした瞬間、AIの理解力が65%低下するのです。

本当に効くのは、自社の開発現場で実際に起きた問題から作られた、必要最小限の、的確なルールです。

「AIセミナーの先」にあるもの

今、多くの企業がAIセミナーに参加し、最新ツールの情報を集めています。それ自体は素晴らしいことです。

しかし、入口で止まっている企業が多すぎるのが現実です。

「すごいツールがある」と知ること。「自社の現場でどう使うか」を設計すること。この2つの間には、想像以上に大きな溝があります。

15万スターのリポジトリも、340件の修正履歴から生まれたルールも、どちらも「道具」にすぎません。大事なのは、自社の業務にどう落とし込むか——その翻訳者がいるかどうかです。

BANSOU CTO™は、まさにその「翻訳」を行うサービスです。技術の最前線を理解した上で、御社の現場に合った形に変換する。15万スターの汎用ツールではなく、御社だけの「340件」を一緒に積み上げていく。

それが、AIを本当に経営に活かすということだと考えています。

株式会社IIWAYO.TECH 代表取締役伊藤翔太 BANSOU CTO™ — AIを「入口」で終わらせない、伴走型フラクショナルCTOサービス

次に読むおすすめ

「「システム会社に頼むのは、もうやめたほうがいい」——中小企業のシステム内製化が、いま現実解になった理由」
「AIで700万行のコードを生成した「バイブコーディング」とは何か。従来の26年分の工数を4ヶ月で実現した開発手法の全貌」
「AI開発ツールで電子契約システムを作って壁にぶつかった話〜Claude Opusと一緒に解決した全記録〜」