mlupinのブログ

2022/02/17(木)22:21

Visual Studio Code拡張機能でPythonでデータ分析入門 その4

Python(130)

Visual Studio Code拡張機能でPythonでデータ分析入門 その4 # 特集1 Visual Studio Code拡張機能でPythonでデータ分析入門# #『日経ソフトウエア』2022年03月号(p.15~p.18) ## ステップ2「データを整形する」 #    ① 表の列名(カラム名)を整形する #    ② 数値ではないデータを置き換える # # プログラムコのサンプルードは、​こちら​から入手可能。 # # ① 表の列名(カラム名)を整形する # # リスト2●CSVファイルを「DataFrame」形式で読み込み、不要な部分を削除するコード##  (1) 「pandas」モジュールを「pd」という名前でインポートする。 import pandas as pd ## (2)CSVファイルの読み込みは、「pd.read_csv()」で行う。# 「ma030000.csv」ファイルを読み込み、「data」という「DataFrame」形式の変数に代入する。# 「ma030000.csv」ファイルは、日本語を含むCSVファイルなので、文字化けしないように# 「"Shift-jis"」の文字コードを指定している。# 「skiprows=4」という引数を指定することで、先頭4行を読み飛ばす。# 「pd.read_csv()」では、デフォルトで、先頭1行目が自動的に表の列名として読み込まれてしまう#  ので、列名を設定しないように、「header=None」を指定している。data = pd.read_csv('ma030000.csv',                    encoding="Shift-jis",                    skiprows=4,                    header=None)# (3)「drop」メソッドを使って、変数「data」から指定した行や列を削除する。#   ここでは、下から21行分を削除する。data.drop(data.tail(21).index, inplace=True)# (4)「data.head()」は、変数「data」の先頭5行分を表示するコード。data.head() リスト2の実行結果

続きを読む

このブログでよく読まれている記事

もっと見る

総合記事ランキング

もっと見る