【Python】CSV ファイルを結合@Google Colab

Google ColabでPythonを使って、GoogleDrive上にある複数のCSVファイルを結合して一つのファイルにまとめるやり方をまとめます。

前提条件

結合対象のCSVファイルはすべて下記の条件であること

  • Google Drive上のマイドライブに保存されている
  • 列数・列順が等しい

Google DriveにCSVを格納

Google Drive上に、結合するファイルを格納するinputフォルダと、一つにしたファイルを出力するoutputフォルダを作成します

inputフォルダに結合したいファイルを複数保存します

Person1~3の3ファイルを用意しました

Google Colab上での対応

https://colab.research.google.com/

ドライブをマウント

Google Colabにコードを書く前に、自分のドライブをColabから参照できるようにする必要があります

下の画像の赤線を引いたアイコンをクリックして、ドライブに接続できるように設定します

マウントすると、下の画像のようにdriveを参照できることが確認できます

コード上でマウント

コード上でマウントをすることもできます

from google.colab import drive
drive.mount('/content/drive')

コードを書く

※文字コードがutf-8の場合は、encording=”sjis”は消してください

import os
import pandas as pd

## 入力パス
inputDirectory = "/content/drive/MyDrive/test/input/"
## 出力パス
outputDirectory = "/content/drive/MyDrive/test/output/"

## フォルダ内のCSVファイルの一覧を取得
files = sorted(os.listdir(inputDirectory))

## CSVファイルの中身を読みだして、リストに追加
csv_list = []
for file in files:
  csv_list.append(pd.read_csv(f"{inputDirectory}{file}", encoding="sjis"))

## CSVファイルの結合
merge_csv = pd.concat(csv_list)

## CSVファイルの出力
merge_csv.to_csv(f"{outputDirectory}union.csv",encoding="sjis")

## 完了
print(f"出力ファイル:{outputDirectory}union.csv")

処理が完了すると、outputフォルダに出力されます

Leave a Reply

Your email address will not be published. Required fields are marked *