Python

【Python】CSV ファイルを結合@Google Colab

Google ColabでPythonを使って、GoogleDrive上にある複数のCSVファイルを結合して一つのファイルにまとめるやり方をまとめます。

前提条件

結合対象のCSVファイルはすべて下記の条件であること

  • Google Drive上のマイドライブに保存されている
  • 列数・列順が等しい

Google DriveにCSVを格納

Google Drive上に、結合するファイルを格納するinputフォルダと、一つにしたファイルを出力するoutputフォルダを作成します

inputフォルダに結合したいファイルを複数保存します

Person1~3の3ファイルを用意しました

Google Colab上での対応

https://colab.research.google.com/

ドライブをマウント

Google Colabにコードを書く前に、自分のドライブをColabから参照できるようにする必要があります

下の画像の赤線を引いたアイコンをクリックして、ドライブに接続できるように設定します

マウントすると、下の画像のようにdriveを参照できることが確認できます

コード上でマウント

コード上でマウントをすることもできます

from google.colab import drive
drive.mount('/content/drive')

コードを書く

※文字コードがutf-8の場合は、encording=”sjis”は消してください

import os
import pandas as pd

## 入力パス
inputDirectory = "/content/drive/MyDrive/test/input/"
## 出力パス
outputDirectory = "/content/drive/MyDrive/test/output/"

## フォルダ内のCSVファイルの一覧を取得
files = sorted(os.listdir(inputDirectory))

## CSVファイルの中身を読みだして、リストに追加
csv_list = []
for file in files:
  csv_list.append(pd.read_csv(f"{inputDirectory}{file}", encoding="sjis"))

## CSVファイルの結合
merge_csv = pd.concat(csv_list)

## CSVファイルの出力
merge_csv.to_csv(f"{outputDirectory}union.csv",encoding="sjis")

## 完了
print(f"出力ファイル:{outputDirectory}union.csv")

処理が完了すると、outputフォルダに出力されます

エンジニアの転職ならこれ!

【第二新卒向け】マイナビジョブ20's

マイナビジョブ20'sは、20代・第二新卒・既卒向けの転職エージェントです。

▼こんな方におすすめ
・はじめて転職しようと思っている
・転職できるだけのスキルが自分にあるか不安
・手厚いサポートを受けたい

【フリーランス向け】 Midworks

Midworksは豊富な案件と「フリーランス」と「正社員」の良いとこ取りをした働き方を実現する手厚い保障が特徴です。

▼こんな方におすすめ
・現在正社員でフリーランスになろうか悩んでいる
・フリーランスとして働いているが、先行きが不安がある  (安定的な案件確保や保障など)
・自分の市場価値を知りたい、見合った案件で参画したい
・今後のキャリアビジョンを踏まえて案件を選びたい