Sådan åbner du virkelig store tekst- og CSV-filer

MS Excel kan vise 1.048.576 rækker. Selvom det kan virke som et rigtig stort antal ved normal brug, er der masser af scenarier, hvor det ikke er helt nok.

Uanset om du ser på logfiler eller store datasæt, er det nemt at støde på CSV - filer med millioner af rækker eller enorme tekstfiler. Da Excel ikke kan understøtte så store filer, hvordan åbner du dem så? Lad os finde ud af det.

Hvorfor kan normale teksteditorer(Normal Text Editors) ikke åbne virkelig store filer(Open Really Large Files) ?

En computer har gigabyte lagerplads, så hvorfor kan teksteditorer ikke åbne store filer?

Der er to faktorer i spil her. Nogle applikationer har en hårdkodet grænse for, hvor meget data de kan vise. Det er lige meget, hvor meget hukommelse din pc har, de vil bare ikke bruge den.

Det andet problem er RAM . Mange teksteditorer har ikke en hård grænse for antallet af rækker, men kan ikke vise store filer på grund af hukommelsesbegrænsninger. De indlæser hele filen i systemets RAM , så hvis denne hukommelse ikke er stor nok, mislykkes processen.

Metode #1: Brug af gratis redaktører

Den bedste måde at se ekstremt store tekstfiler på er at bruge ... en teksteditor. Ikke en hvilken som helst teksteditor, men de værktøjer, der er beregnet til at skrive kode. Sådanne apps kan normalt håndtere store filer uden problemer og er gratis.

Large Text File Viewer er sandsynligvis den enkleste af disse applikationer. Det er virkelig nemt at bruge, fungerer hurtigt og har et meget lavt ressourceaftryk. Den eneste ulempe? Den kan ikke redigere filerne. Men hvis du kun vil se store CSV- filer, er dette uden tvivl det bedste værktøj til jobbet.

For også at redigere store tekstfiler, bør du prøve Emacs . Oprindeligt skabt til Unix- systemer, fungerer det også perfekt på Windows og kan håndtere store filer. På samme måde er Neovim og Sublime Text to lette IDE'er(IDEs) , der kan bruges til at åbne gigabyte-størrelse CSV - tekstfiler.

Hvis alt du leder efter er at søge efter data gennem store logfiler, så er klogg lige værktøjet for dig. En opdateringsgaffel af den populære glogg , denne applikation giver dig mulighed for nemt at udføre komplekse søgeoperationer gennem enorme tekstfiler. Da computergenererede logfiler ofte kan have millioner af rækker, er klogg designet til at arbejde med sådanne filstørrelser uden problemer.

Metode(Method) #2: Opdel i flere dele(Into Multiple Parts)

Hele problemet med at prøve at åbne store CSV- filer er, at de er for store. Men hvad nu hvis du skulle opdele disse i flere mindre filer?

Dette er en populær løsning, da det generelt ikke indebærer at skulle lære grænsefladen til en ny teksteditor. I stedet kan du bruge en af ​​de mange CSV(one of the many CSV splitters available online) -splittere, der er tilgængelige online, til at dele den store fil op i en række nemme at åbne filer. Hver af disse filer kan derefter tilgås normalt.

Dette er dog ikke den bedste måde at gøre dette på. Opdeling af en stor fil kan ofte føre til mærkelige tastefejl eller forkert konfigurerede filer. Desuden forhindrer åbning af hver chunk separat dig i at filtrere gennem alle data på én gang.

Metode #3: Importer til en database

Tekst- og .csv-filer, der strækker sig til flere gigabyte, er generelt store datasæt. Så hvorfor ikke bare importere dem til en database?

SQL er det mest almindelige databasemarkeringssprog, der bruges i disse dage. Der er mange versioner af SQL(many versions of SQL) i brug, men den nemmeste er nok MySQL . Og som heldet ville have det, er det muligt at konvertere en CSV-fil til en MySQL-tabel(convert a CSV file into a MySQL table) .

Dette er på ingen måde den nemmeste metode til at håndtere store CSV- filer, så vi anbefaler kun dette, hvis du ønsker at håndtere store datasæt på en regelmæssig basis. Hvis MySQL lyder for hårdt, kan du altid importere dine .csv-filer til MS Access i stedet for.

Metode(Method) #4: Analysér med Python- biblioteker

Når du arbejder med en .csv-fil med millioner af rækker af data, vil du naturligvis ikke være i stand til at få meget mening ud af det manuelt. Du vil sandsynligvis filtrere dataene og køre specifikke forespørgsler for at forstå tendenser.

Så hvorfor ikke skrive Python-kode(write Python code) for at gøre netop det?

Endnu en gang er dette ikke den mest brugervenlige metode. Selvom Python ikke er det sværeste programmeringssprog at lære(Python isn’t the hardest programming language to learn) , er det kodning, så det er måske ikke den bedste tilgang for dig. Alligevel, hvis du finder dig selv nødt til at parse gennem virkelig store CSV - filer på daglig basis, vil du måske automatisere opgaven med noget Python-kode(automate the task with some Python code) .

Metode #5: Med Premium Tools

De teksteditorer, vi så i den første metode, var ikke dedikerede værktøjer beregnet til CSV- behandling. De var generelle værktøjer, der også kunne bruges til at arbejde med store .csv-filer.

Men hvad med specialiserede applikationer? Er der ingen apps derude, der er skabt til at løse dette problem?

Det er der faktisk. CSV Explorer bygger for eksempel på selve den proces, vi beskrev i de sidste to metoder ( SQL - database og Python -kode) til at skabe en app, der er i stand til at se og redigere CSV - filer af enhver størrelse. Du kan gøre alt, hvad du forventer af et regnearksværktøj som at oprette grafer eller filtrere dataene i CSV Explorer .

En anden mulighed er UltraEdit . I modsætning til det tidligere værktøj er dette ikke kun beregnet til .csv-filer, men til enhver type tekstfil. Det kan nemt håndtere tekst- og CSV -filer, der spænder op til et par gigabyte, med en grænseflade, der ligner mange af de gratis redaktører, vi diskuterede tidligere. 

Den eneste ulempe ved disse værktøjer er, at de er premium-applikationer, der kræver, at du får en betalt licens for at kunne bruge dem. Du kan altid prøve deres gratis prøveversioner for at se deres funktioner, eller hvis du kun har en engangsbrug.

Hvad er den bedste måde at åbne store tekst-(Large Text) og CSV-filer(CSV Files) på ?

I denne tid med Big Data er det ikke ualmindeligt at løbe ind i tekstfiler, der løber op i gigabyte, hvilket kan være svært selv at se med indbyggede værktøjer som Notesblok(Notepad) eller MS Excel . For at kunne åbne så store CSV -filer skal du downloade og bruge et tredjepartsprogram.

Hvis alt du ønsker er at se sådanne filer, så er Large Text File Viewer det bedste valg for dig. For faktisk at redigere dem, kan du prøve en funktionsrig teksteditor som Emacs eller gå efter et premium-værktøj som CSV Explorer .

Teknikker som at opdele CSV -filen eller importere den til en database involverer bare for mange trin. Du er bedre stillet at få en betalt licens til et dedikeret premium-værktøj, hvis du synes, at du arbejder meget med store tekstfiler.



About the author

Jeg er en computerekspert med over 10 års erfaring i software- og browserindustrien. Jeg har designet, bygget og administreret hele installationer af softwareprogrammer, samt udviklet og vedligeholdt browsere. Min erfaring giver mig muligheden for at give klare, præcise forklaringer af komplicerede emner – uanset om det er, hvordan Microsoft Office fungerer, eller hvordan man får mest muligt ud af Mozilla Firefox. Ud over mine computerfærdigheder er jeg også en dygtig forfatter og kan kommunikere effektivt online og personligt.



Related posts