はじめに
Pythonで機械学習の勉強をはじめるようになって、ファイルを読み込むことが多くなった。
その際、UTF-8フォーマットじゃないと何かと
“` UnicodeDecodeError: ‘utf-8’ codec can’t decode byte “`
というエラーに陥ることになってしまったので、手順をまとめる
nkfコマンドのinstall
macでデフォルトで入っていないのでbrewコマンドでinstallする
“`brew install nkf “`
変換
まずは作業前
$ file --mime data.csv data.csv: text/plain; charset=unknown-8bit
変換コマンド
“` nkf -w –overwrite data.csv “`
$ file --mime data.csv data.csv: text/plain; charset=utf-8
文字コードが代わり、エラーは出なくなった。