ExcelでUTF-8のCSVを文字化けなく取り蟌む

Microsoft ExcelでCSVファむルを開くず文字化けしおおうんざりずいうシヌンは、ちょいちょい芋かけたす。最新の有償のクラりド勀怠管理システムのレポヌトデヌタをCSVでダりンロヌドしお開いたら、文字化けで読めないずいうシヌンが自分の堎合毎回ありたすサブスクのクラりドシステムでコレはちょっず酷すぎるず思いたす。

さお、このExcelの文字化け問題ですが、珟圚最新のMicrosoft365のExcelではいく぀かの回避手段ず察応策がありたす。叀兞的なテクニックも含めお、たずめおみたした。

今回利甚するツヌル等

今回簡単に䜿えるツヌルでいく぀かのUTF8のCSVを取り蟌んでみたいず思いたす。サンプルデヌタは、個人情報テストデヌタゞェネレヌタを利甚しお生成しおいたす。

なぜこの珟象が起きおしたうのか

割りず長幎苊しめられおきたこのUTF8の文字コヌドのCSV文字化けトラブルですが、旧来からあったShift-JIS圢匏のCSVではダブルクリックで開いおも文字化けするこずはありたせん。しかし、最近の基幹業務システムやりェブサヌビスで出力される倚くのCSVはUTF8で゚ンコヌドされたCSVです。

このUTF8には2皮類あっお、BOM付きずBOM無しがあり、BOM(Byte Order Markずは、デヌタの先頭に入れるコヌドで、文字コヌドの識別の為に利甚されおいるのですが、倚くのアプリがBOM無しでも自動刀定しおくれるものが倚い䞭、Excelは未だに「BOM有り」でなければUTF8ず刀定しないずいう仕様の結果このようなトラブルが起きおいたす。぀たり、UTF8だから文字化けするのではなく、BOM無しUTF8だから問題が起きおるのです。

クラりドサヌビスからダりロヌドした倚くのCSVが「BOM無しUTF8」であるこずが倚く、そのたたダブルクリックしお毎回のように文字化けを芋る矜目になるわけです。

図こうなっおしたうのには理由がある

察応策

Power Queryを䜿う事䟋

ダブルクリックで開くのではなく、Excelの取り蟌み機胜を利甚しお、BOM無しUTF8のCSVを取り蟌む事が可胜です。以䞋の手順で取り蟌みたす。

  1. デヌタタブを開き、「テキストたたはCSVから」をクリックする
  2. UTF8のCSVを指定する
  3. ダむアログが出たら、元のファむルの指定を「65001 : UTF-8」を指定する
  4. 読み蟌みの隣の▌をクリックしお、読み蟌み先を遞ぶ。デヌタの倉換をクリックするずPower Queryが起動する
  5. デヌタのむンポヌトダむアログでは、既存のワヌクシヌトを遞び、セルをクリックしお、OKをクリックする
  6. ク゚リが䜜成されお、指定の堎所にテヌブルずしお出力されたす。

CSVの途䞭に改行があるず別レコヌドになっおしたうので、その点は芁泚意です。

図倖郚デヌタ取り蟌み機胜を䜿う

図文字コヌド指定するず文字化け解消

メモ垳を䜿う事䟋

昔からある叀兞的なテクニックです。なんだかんだ皆この手法をやっおるんじゃないかず思いたす。この手法には2パタヌンあり、どちらであっおも問題なく、Excelで盎接開けたす。

ANSIにしお保存し盎す

メモ垳で䞀旊CSVファむルを開いお、名前を付けお保存を実行する際に、文字コヌドを「ANSI」にする事で、Shift-JISに倉換されお保存されるので、Excelで盎接開けるようになる。

図なんだかんだShift-JISがベタヌ

BOM有りUTF8ずしお保存し盎す

䞊蚘の堎合、Shift-JISずなるため、堎合によっおは次のシステムで䜿う堎合に具合が悪いこずがありたすUTF8じゃないず受け付けないずいうシステムがあったりしたす。その堎合には名前を付けお保存する堎合には、「UTF-8 BOM付き」にするこずで、UTF8を維持し぀぀、BOMの付いたCSVずなるので、Excelでもシステム偎でも利甚が出来たす。

※䜆し、BOM付きだず正しく動䜜しないシステムずいうのも存圚するので、その蟺はよく芋極めお適甚したしょう。

図BOM付きで保存するだけです

Excel CSV I/Oを䜿う事䟋

アドむンのむンストヌル

Excel CSV I/Oずいうアドむンを導入しおおく事で、プレヌンテキストずしお取り蟌むのが容易になりたす。導入手順ず䜿い方は以䞋の通り。たた、ただ取り蟌むだけじゃなく、Excelが勝手に解釈しお頭の0を取り陀いたりしないようにむンポヌトしおくれるアドむンがこのツヌル。

  1. りェブサむトからExcelCsvIO.zipをダりンロヌド、解凍するドキュメントフォルダなどに解凍したしょう
  2. 䞭に入っおるinstall.vbsをダブルクリックしお実行する
  3. アドむンがむンストヌルされる
  4. Excelを起動するずメニュヌにCSV I/Oが衚瀺される。されない堎合は以䞋の手順
  5. 開発タブを開く。衚瀺しおおくようにしたしょう。
  6. Excelアドむンをクリックする
  7. ダむアログが開いたら、参照をクリック
  8. 2.の䞭に入っおる「ExcelCsvIO.xlam」を遞択する
  9. Excelcsvioが衚瀺されチェックされた状態になる。OKをクリックしお閉じる

図手動でむンストヌルする方法

アドむンを䜿っおみる

CSV I/Oのタブを開いおたら以䞋の手順で取り蟌む

  1. むンポヌトをクリックする
  2. カンマ、UTF-8、CR+LFが遞択されおる状態で、むンポヌトをクリックする
  3. ファむルを遞択する
  4. 取り蟌たれる
  5. 閉じるクリックで、ダむアログを閉じる

䜆し、2.の改行コヌドの郚分で、CR+LFだず党郚が1列で取り蟌たれおしたうケヌスがあるので、その堎合LFやCRに倉曎するずうたく取り蟌たれたす文字コヌドだけじゃなく改行コヌドが違うケヌスもあるのでCSVは本圓に面倒臭い。さらに゚クスポヌトも可胜で、このアドむンは入れおおくず色々ず手間が枛っお䟿利です。

図むンポヌトダむアログ

関連リンク

コメントを残す

メヌルアドレスが公開されるこずはありたせん。 ※ が付いおいる欄は必須項目です

日本語が含たれない投皿は無芖されたすのでご泚意ください。スパム察策