Google ColabでPythonを使って、GoogleDrive上にある複数のCSVファイルを結合して一つのファイルにまとめるやり方をまとめます。
前提条件
結合対象のCSVファイルはすべて下記の条件であること
- Google Drive上のマイドライブに保存されている
- 列数・列順が等しい
Google DriveにCSVを格納
Google Drive上に、結合するファイルを格納するinputフォルダと、一つにしたファイルを出力するoutputフォルダを作成します
inputフォルダに結合したいファイルを複数保存します
Person1~3の3ファイルを用意しました
Google Colab上での対応
https://colab.research.google.com/
ドライブをマウント
Google Colabにコードを書く前に、自分のドライブをColabから参照できるようにする必要があります
下の画像の赤線を引いたアイコンをクリックして、ドライブに接続できるように設定します
マウントすると、下の画像のようにdriveを参照できることが確認できます
コード上でマウント
コード上でマウントをすることもできます
from google.colab import drive
drive.mount('/content/drive')
コードを書く
※文字コードがutf-8の場合は、encording=”sjis”は消してください
import os
import pandas as pd
## 入力パス
inputDirectory = "/content/drive/MyDrive/test/input/"
## 出力パス
outputDirectory = "/content/drive/MyDrive/test/output/"
## フォルダ内のCSVファイルの一覧を取得
files = sorted(os.listdir(inputDirectory))
## CSVファイルの中身を読みだして、リストに追加
csv_list = []
for file in files:
csv_list.append(pd.read_csv(f"{inputDirectory}{file}", encoding="sjis"))
## CSVファイルの結合
merge_csv = pd.concat(csv_list)
## CSVファイルの出力
merge_csv.to_csv(f"{outputDirectory}union.csv",encoding="sjis")
## 完了
print(f"出力ファイル:{outputDirectory}union.csv")
処理が完了すると、outputフォルダに出力されます