毎月末になると、決まって始まる作業がある。複数のCSVファイルを開いて、コピーペーストでデータを一つのシートにまとめて、関数を書いて集計して、グラフを作って、レポートに貼り付ける。慣れてはいても、毎回2〜3時間かかる。「これ、もっと早くできないかな」と思いながら、でもそのままになっていた。
Codexを使ってこの作業を変えようと思ったのは、「Pythonが書ければ自動化できるのに」という諦めの延長だった。プログラミングは少し分かるが、Pythonのデータ処理ライブラリをゼロから書けるほどではない。でも「Codexならコードを書いてくれるんじゃないか」という期待があった。
試してみたら、期待以上のことが起きた。「このCSVの構造を教えるから、月別に集計するPythonコードを書いてください」と依頼しただけで、pandasを使ったコードが返ってきた。自分ではゼロから書けないコードが、5分で動く形になった。
この記事では、データの集計・分析作業にCodexを使う具体的な方法と、実際に変わったことを書いていく。プログラミングが得意でない方にも、使い始められる入口まで示したい。
結論から言うと、Codexはデータ処理のコードを生成することで、「Excelの限界を超えた分析」をプログラミングの専門知識なしに始めるための入口になってくれる。ただし、生成されたコードを動かす最低限の環境構築と、結果の検証は自分で行う必要がある。
なぜデータ分析にCodexが使えるのか
Codexとは、OpenAI社が提供するAIコーディングエージェントのことだ。自然言語でやりたいことを説明すると、それを実現するコードを生成してくれる。データ分析の文脈では、Pythonのpandasやmatplotlibなどのライブラリを使ったコードを生成することが得意だ。
Codexはデータ処理コードを書くのが得意
データの集計・結合・フィルタリング・グラフ作成といった処理は、パターンが決まっていることが多い。「月別に売上を集計する」「特定の条件でデータを絞り込む」「2つのファイルを特定のキーで結合する」——こうした処理は、やりたいことを言葉で説明すればCodexが対応するコードを生成してくれる。
Pythonのpandasというライブラリは、データ処理のデファクトスタンダードだ。Excelで数時間かかる作業が、pandasのコードなら数秒で終わることもある。しかしpandasは覚えることが多く、ゼロから書き始めるには学習コストが高い。Codexはこの学習コストを飛び越えて「やりたい処理を書いてくれる」という役割を担ってくれる。
ExcelだけではできないことをCodexで突破する
Excelは強力だが、限界もある。ファイルサイズが大きくなると動作が重くなる。複数のファイルを横断した処理が難しい。自動化のためにVBAを書くのはハードルが高い。同じ処理を毎月手動で繰り返すしかない——こうした「Excelの壁」を多くのデータ担当者が経験している。
Codexが生成するPythonコードは、これらの壁を越えられる。数百万行のデータも処理できる。複数のCSVファイルを自動で読み込んで結合できる。同じ処理を毎回手動でやる代わりに、コードを一度作ればボタン一つで実行できる。
Codexは「Pythonが書けない人」と「Excelの限界を超えたデータ処理」の間に橋をかけてくれる存在だ。完全にプログラミング不要とはいかないが、必要な知識の敷居を大幅に下げてくれる。
Codexにデータ分析を依頼する具体的な方法
CSVのデータ構造を伝える方法
Codexにデータ処理を依頼するときは、CSVファイルの構造を伝えることが最初のステップだ。実際のデータ(特に機密情報が含まれる場合)をそのまま渡す必要はなく、カラム名と数行分のサンプルデータを渡すだけで十分なことが多い。
効果的な伝え方の例:「以下の構造のCSVファイルがあります。カラムは日付、商品ID、商品名、売上金額、数量です。このデータを月別・商品別に集計するPythonコード(pandas使用)を書いてください。」
カラム名だけでなく、データの型(日付形式・数値・文字列)も伝えると精度が上がる。「日付カラムは’2026-01-15’の形式です」「売上金額は数値でカンマなしです」のような情報を加えることで、より使えるコードが返ってくる。
集計・グラフ・分析を依頼するパターン
依頼の種類別に、効果的な依頼パターンを整理する。
- 集計:「月別に売上の合計・平均・最大値を集計して、結果をCSVで出力するコードを書いてください」
- フィルタリング:「売上金額が10万円以上で、かつ2026年1月以降のデータだけを抽出するコードを書いてください」
- 結合:「顧客マスタCSVと売上データCSVを顧客IDで結合するコードを書いてください」
- グラフ:「月別売上の折れ線グラフをmatplotlibで作成し、PNG形式で保存するコードを書いてください」
- 自動化:「毎月同じ処理を実行するため、フォルダ内のすべてのCSVを処理して一つのファイルにまとめるコードを書いてください」
「Pythonコードを書いてください」と明示することと、使いたいライブラリ(pandas・matplotlib・openpyxlなど)を指定することで、より実用的なコードが返ってきやすくなる。
実際に試してよかった使い方
面倒な集計処理の自動化
毎月繰り返していた集計作業をCodexで自動化した体験が、最も印象に残っている。売上データのCSVを読み込み、部署別・月別に集計し、前月比を計算して、Excelファイルで出力する——という一連の処理をCodexに依頼した。
最初に返ってきたコードは、一部の部分が自分の環境と合っていなかった。日付のフォーマットが違ったため、エラーが出た。そのエラーメッセージをCodexに渡して「このエラーを修正してください」と依頼したら、修正版が返ってきた。2回のやりとりで動くコードになった。
完成したコードを保存しておけば、翌月からは同じフォルダに新しいCSVを置いてコードを実行するだけで、以前2〜3時間かかっていた作業が数秒で終わるようになった。
複数ファイルのデータを結合・比較する
Excelで最も手間がかかる作業の一つが、複数のファイルにまたがったデータの結合だ。たとえば、毎月の売上ファイル12本を一つにまとめる作業は、Excelでは手動でのコピーペーストが必要になる。
Codexに「フォルダ内のすべてのCSVファイルを読み込んで縦に結合し、一つのCSVに出力するコードを書いてください」と依頼すると、数行のPythonコードが返ってきた。フォルダにCSVを入れてコードを実行するだけで、12ファイルが瞬時に結合される。
さらに「結合したデータを年月カラムで集計し、前年同月比を計算してください」と追加で依頼することで、分析の深さも上げられた。Excelで同じことをしようとすると、VLOOKUP関数と手作業の組み合わせで1〜2時間かかる処理が、コード1本で完結した。
Codexデータ分析の注意点
データのプライバシーへの配慮
Codexにデータを渡すときは、個人情報・機密情報の取り扱いに注意が必要だ。顧客名・メールアドレス・住所・電話番号などの個人情報が含まれるデータは、そのまま渡さないことを徹底してほしい。
安全な渡し方は、「カラム構造だけを伝えてサンプルデータは架空の値にする」ことだ。「日付, 顧客ID, 金額という構造で、例えばこんなデータです:2026-01-15, C001, 15000」のように、実際のデータではなく構造を説明する形で依頼できる。
業務でのデータ分析にCodexを使う場合は、組織のデータガバナンスポリシーを確認することを推奨する。OpenAIのBusinessプランやEnterpriseプランでは、送信したデータがモデルのトレーニングに使われないことが保証されているが、個人プランでは設定を確認した上で使用する必要がある。
生成コードの検証が必要
Codexが生成したコードは、必ず動作確認と結果の検証を行うこと。特にデータの集計処理では、「コードは動いているが計算結果が間違っている」という事態が起きやすい。
検証の方法として有効なのは、小さなサンプルデータで試してから本番データに適用することだ。結果が正しいかどうかは、手計算や既知の値と比較することで確認できる。「合計が合っているか」「フィルタリングの条件が正しく適用されているか」を必ず確認してから、本番の処理に使うようにしてほしい。
データ分析の文脈では、コードが「動くこと」と「正しい結果を出すこと」は別の問題だ。Codexが生成したコードはエラーなく実行されても、集計ロジックが自分の意図と違う場合がある。結果の妥当性は常に自分で判断する必要がある。
ExcelユーザーがCodexを使い始めるためのステップ
Pythonが書けなくても使える入口
Codexを使ってデータ分析を始めるために、Pythonが書ける必要はない。しかし、Codexが生成したコードを「実行する環境」は必要だ。最も手軽な環境として推奨するのは以下の2つだ。
- Google Colab(Googleアカウントがあれば無料で使えるブラウザ上のPython実行環境。インストール不要)
- Jupyter Notebook(ローカルPCで動かす場合。AnacondaをインストールするとJupyterも使えるようになる)
Google Colabは特に取り組みやすい。ブラウザで開いてCodexが生成したコードを貼り付け、実行ボタンを押すだけで動く。CSVファイルのアップロードもGoogle Driveを経由して簡単にできる。
最初の1本のコードを動かすまで
初めてCodexでデータ処理のコードを動かすまでの流れを整理する。
- 手元にある小さなCSVファイル(本番データでなくサンプル)を用意する
- CSVのカラム名と数行のサンプルをCodexに伝え、「このデータを読み込んで行数と各カラムの統計情報を表示するPythonコードをpandasで書いてください」と依頼する
- Google Colabを開き、生成されたコードを貼り付ける
- CSVファイルをColabにアップロードし、コードを実行する
- エラーが出たら、エラーメッセージをCodexに渡して修正してもらう
最初の1本が動けば、次の依頼への感覚が大きく変わる。「Codexに言えばコードが返ってきて、Colabで実行できる」という体験を一度積むことが、この使い方への入口になる。
よくある質問(FAQ)
Q1. プログラミング未経験でもCodexでデータ分析はできますか?
コードを書く必要はありませんが、コードを実行する環境の準備と、エラーが出たときの対処(エラーをCodexに渡して修正してもらう)ができる程度の理解は必要です。Google Colabを使えば環境構築はほぼ不要なので、「コードを書かなくてもコードを動かすことができる」状態までは比較的簡単にたどり着けます。ただし、生成されたコードの結果が正しいかどうかを判断するためには、扱うデータへの理解が必要です。
Q2. ExcelファイルをそのままCodexで処理できますか?
はい、できます。PythonのopenpyxlやpandasはExcelファイル(.xlsxや.xls)を直接読み書きできます。Codexに「このExcelファイルを読み込んで〜する処理を書いてください。ファイルはopenpyxlで読み込んでください」と依頼することで、ExcelファイルをCSVに変換せずに処理するコードが返ってきます。また、処理結果をExcelファイルとして出力することも指定できます。
Q3. データの可視化(グラフ作成)もCodexで依頼できますか?
できます。matplotlibやseabornなどのPython可視化ライブラリを使ったグラフ作成コードを生成してくれます。「月別売上の棒グラフを作成し、PNG形式で保存してください」「散布図で2変数の相関を可視化してください」のように、グラフの種類と保存形式を指定して依頼するのが効果的です。グラフの色・タイトル・軸ラベルの設定なども自然言語で指示できます。
Q4. データ量が多い場合でもCodexのコードは使えますか?
はい、pandasで生成されたコードはExcelと違い、大量のデータ処理が得意です。数十万行・数百万行のデータでも処理できます。ただし、PCのメモリ容量によっては非常に大きなデータセット(数GB以上)でメモリ不足になる場合があります。そういった場合は、Codexに「メモリ効率を考慮してチャンク処理してください」と指示することで、大きなファイルを分割して処理するコードを生成してもらえます。
Q5. 統計分析や機械学習もCodexで依頼できますか?
できます。相関分析・回帰分析・クラスタリングなどの統計分析や、scikit-learnを使った機械学習モデルの構築コードも生成できます。ただし、どの分析手法を選ぶべきか・結果をどう解釈すべかという判断には、統計・機械学習の基礎知識が必要です。Codexはコードを生成してくれますが、「どのアルゴリズムを使うべきか」「p値の意味は何か」といった分析の本質的な判断は、自分で理解している必要があります。
Q6. 作成したコードを定期実行(スケジュール実行)することはできますか?
Codexが生成したPythonコードは、定期実行の仕組みと組み合わせることができます。Windowsならタスクスケジューラ、Macならcron、クラウド環境ならAWS LambdaやGoogle Cloud Schedulerを使って定期実行できます。Codexに「このコードをWindowsのタスクスケジューラで毎月1日に実行するための設定方法を教えてください」と依頼すると、設定手順も説明してもらえます。
Q7. Codexでデータ分析をするメリットは、BIツールと比べてどう違いますか?
TableauやPower BIなどのBIツールは、GUIで操作できるため非エンジニアでも使いやすいですが、ライセンスコストがかかり、カスタムな処理には限界があります。CodexでPythonコードを生成する方法は、ライセンスコストがほぼかからず、どんな複雑な処理もコードで対応できる柔軟性があります。一方で、BIツールのようなインタラクティブなダッシュボードの作成は、Codexだけでは難しいです。「複雑なデータ処理を自動化したい」「BIツールのコストを抑えたい」という場合にCodexのアプローチが向いています。
まとめ:Excelの先にある世界が、Codexで見えてきた
データの集計・分析にCodexを使い始めてから変わったことを整理する。
以前は、毎月の集計作業に2〜3時間かかっていた。「Pythonで自動化できれば」と思いながらも、学習コストの高さから諦めていた。Codexを使い始めてから、コードを書く知識なしにPythonの処理を使えるようになった。最初に時間をかけてコードを作れば、翌月からは数秒で終わる作業になった。
変化したのは時間だけではない。「Excelの限界」と思っていた壁が、実は超えられるものだと気づいた。複数ファイルの結合、大量データの処理、繰り返し作業の自動化——これらは「Pythonを書けるエンジニアだけができること」ではなくなった。Codexと実行環境があれば、データを扱う仕事をしている人なら誰でも近づける領域になっている。
Codexはデータ分析の専門家になるための近道ではないが、「Excelでは限界を感じていた処理を、今日から試してみる」ための入口になる。
毎月繰り返している集計作業がある方は、一度Codexに「このCSVを月別に集計するPythonコードを書いてください」と試してみてほしい。思ったよりも早く、使えるコードが返ってくるはずだ。