本当に大きなテキストファイルとCSVファイルを開く方法

MSExcelは1,048,576行を表示できます。通常の使用ではそれは非常に多いように見えるかもしれませんが、それだけでは不十分なシナリオはたくさんあります。

ログファイルでも大きなデータセットでも、数百万行のCSVファイルや膨大なテキストファイルを簡単に見つけることができます。Excelはこれほど大きなファイルをサポートできないので、どの程度正確にファイルを開きますか?確認してみましょう。

通常のテキストエディタが(Normal Text Editors)本当に大きなファイルを開か(Open Really Large Files)ないのはなぜですか?

コンピューターにはギガバイトのストレージがあるのに、なぜテキストエディターで大きなファイルを開くことができないのでしょうか。

ここでは2つの要素が関係しています。一部のアプリケーションには、表示できるデータの量にハードコードされた制限があります。あなたのPCがどれだけのメモリを持っているかは関係ありません、彼らはただそれを使用しません。

2番目の問題はRAMです。多くのテキストエディタには行数に厳しい制限はありませんが、メモリの制限のために大きなファイルを表示することはできません。ファイル全体をシステムRAMにロードするため、このメモリが十分に大きくない場合、プロセスは失敗します。

方法1:無料のエディターを使用する

非常に大きなテキストファイルを表示する最良の方法は、テキストエディタを使用することです。テキストエディタだけでなく、コードを書くためのツールもあります。このようなアプリは通常、大きなファイルを問題なく処理でき、無料です。

ラージテキストファイルビューア(Large Text File Viewer)は、おそらくこれらのアプリケーションの中で最も単純です。非常に使いやすく、高速に動作し、リソースのフットプリントが非常に低くなっています。唯一の欠点は?ファイルを編集することはできません。ただし、大きなCSV(CSV)ファイルのみを表示したい場合は、これがその作業に最適なツールです。

大きなテキストファイルを編集する場合も、Emacsを試してみてください。もともとはUnixシステム用に作成されましたが、 (Unix)Windowsでも(Windows)完全に機能し、大きなファイルを処理できます。同様に、NeovimSublime Textは、ギガバイトサイズの(Sublime Text)CSVテキストファイルを開くために使用できる2つの軽量IDEです。(IDEs)

探しているのが大きなログファイルからデータを検索することだけである場合、kloggはまさにあなたのためのツールです。人気のあるglogg(glogg)の更新フォークであるこのアプリケーションを使用すると、膨大なテキストファイルから複雑な検索操作を簡単に実行できます。コンピューターで生成されたログファイルには数百万行が含まれることが多いため、kloggはそのようなファイルサイズで問題なく動作するように設計されています。

方法(Method)2:複数の部分に分割する(Into Multiple Parts)

大きなCSV(CSV)ファイルを開こうとする際の全体的な問題は、それらが大きすぎることです。しかし、これらを複数の小さなファイルに分割するとどうなるでしょうか。

これは、一般的に新しいテキストエディタのインターフェイスを学習する必要がないため、一般的なソリューションです。代わりに、オンライン(one of the many CSV splitters available online)で利用できる多くのCSVスプリッターのいずれかを使用して、大きなファイルをいくつかの読みやすいファイルに分割できます。これらの各ファイルには、通常どおりアクセスできます。

ただし、これはこれを実行するための最良の方法ではありません。大きなファイルを分割すると、多くの場合、奇妙なタイプミスや不適切に構成されたファイルが発生する可能性があります。さらに、各チャンクを個別に開くと、データ全体を一度にフィルタリングできなくなります。

方法3:データベースにインポートする

数ギガバイトに拡張されるテキストファイルと.csvファイルは、通常、大きなデータセットです。では、それらをデータベースにインポートしてみませんか?

SQLは、最近使用されている最も一般的なデータベースマークアップ言語です。使用されているSQLには多くのバージョンがあります(many versions of SQL)が、最も簡単なのはおそらくMySQLです。運が良ければ、CSVファイルをMySQLテーブルに変換する(convert a CSV file into a MySQL table)こともできます。

これは決して大きなCSVファイルを処理する最も簡単な方法ではないため、定期的に大きなデータセットを処理する場合にのみこれをお勧めします。MySQLが難しすぎるように思われる場合は、代わりに.csvファイルをいつでもMSAccessにインポートできます(MS Access)

方法(Method)4:Pythonライブラリを使用して分析する

数百万行のデータを含む.csvファイルを使用している場合、手動でそれを理解することは明らかにできません。傾向を理解するために、データをフィルタリングし、特定のクエリを実行することをお勧めします。

では、それを行うためのPythonコード(write Python code)を書いてみませんか?

繰り返しますが、これは最もユーザーフレンドリーな方法ではありません。Pythonは習得するのが最も難しいプログラミング言語(Python isn’t the hardest programming language to learn)ではありませんが、コーディングであるため、最善のアプローチではない可能性があります。それでも、非常に大きなCSV(CSV)ファイルを毎日解析する必要がある場合は、Pythonコードを使用してタスクを自動化すること(automate the task with some Python code)をお勧めします。

方法5:プレミアムツールを使用

最初の方法で見たテキストエディタは、 CSV(CSV)処理専用のツールではありませんでした。これらは、大きな.csvファイルの操作にも使用できる汎用ツールでした。

しかし、特殊なアプリケーションについてはどうでしょうか?この問題を解決するために作成されたアプリはありませんか?

実はあります。たとえば、CSV Explorerは、最後の2つの方法( (CSV Explorer)SQLデータベースとPythonコード)で説明したプロセスに基づいて構築され、任意のサイズの(Python)CSVファイルを表示および編集できるアプリを作成します。グラフの作成やCSVエクスプローラー(CSV Explorer)でのデータのフィルター処理など、スプレッドシートツールに期待するすべてのことを実行できます。

もう1つのオプションはUltraEditです。以前のツールとは異なり、これは.csvファイルだけでなく、あらゆる種類のテキストファイルを対象としています。数ギガバイトの範囲のテキストファイルとCSV(CSV)ファイルを簡単に処理でき、前述の無料のエディターの多くと同様のインターフェイスを備えています。 

これらのツールの唯一の欠点は、プレミアムアプリケーションであり、使用するには有料ライセンスを取得する必要があることです。無料の試用版をいつでも試して、機能を確認することができます。または、1回だけ使用する場合も同様です。

大きなテキスト(Large Text)ファイルとCSVファイル(CSV Files)を開くための最良の方法は何ですか?

ビッグデータ(Big Data)のこの時代では、ギガバイト単位で実行されるテキストファイルに遭遇することは珍しくありません。これは、メモ帳(Notepad)MSExcelなどの組み込みツールで表示することさえ困難な場合があります。このような大きなCSVファイルを開くには、サードパーティのアプリケーションをダウンロードして使用する必要があります。

そのようなファイルを表示するだけの場合は、ラージテキストファイルビューア(Large Text File Viewer)が最適です。実際に編集するには、Emacsのような機能豊富なテキストエディタを試すか、 (Emacs)CSVExplorerのようなプレミアムツールを試してみてください。

CSVファイルを分割したり、データベースにインポートしたりするなどの手法では、手順が多すぎます。巨大なテキストファイルを頻繁に使用する場合は、専用のプレミアムツールの有料ライセンスを取得することをお勧めします。



About the author

私は長年 Android とオフィス ソフトウェアを扱ってきたコンピューター技術者です。私はまた、過去 5 年ほどの間、人々に Mac の使い方を教えてきました。あなたのコンピュータの問題を解決する方法を知っている人を探しているなら、おそらく私がお手伝いできるでしょう!



Related posts