Sådan udtrækkes tabeller fra PDF-dokumenter

Denne artikel viser dig, hvordan du udtrækker tabeller fra PDF-dokumenter(extract tables from PDF documents) . Du har muligvis mange PDF- filer, der indeholder flere tabeller, som du vil bruge separat. At kopiere(Copying) og indsætte disse tabeller er ikke en god mulighed, da det muligvis ikke giver det forventede output, derfor har du brug for nogle andre enkle muligheder, der kan udtrække tabeller fra en PDF -fil og gemme disse tabeller som separate filer.

De fleste af disse PDF-tabeludtræksværktøjer(PDF table extractor tools) kan ikke hjælpe, hvis PDF- tabellen er scannet. I et sådant tilfælde bør du først gøre PDF'en søgbar(make the PDF searchable)  og derefter prøve disse muligheder.

Uddrag tabeller fra PDF-dokumenter

I dette indlæg har vi tilføjet 2 gratis onlinetjenester og 3 gratis software til at udtrække tabeller fra en PDF -fil:

  1. PDF til XLS
  2. PDFtoExcel.com
  3. Tabula
  4. ByteScout PDF-multiværktøj
  5. Sejda PDF-skrivebord.

1] PDF til XLS

PDF til XLS-tjeneste

PDF til XLS er en af ​​de bedste muligheder for at udtrække tabeller fra PDF . Den har to funktioner, der gør den praktisk. Du kan hente tabeller fra 20 PDF- dokumenter sammen. PDF -tabeludtrækningen er også automatisk . Det genererer output som en XLSX -fil. Hvis en PDF -fil har flere tabeller, gemmes hver tabel separat i forskellige ark af output XLSX -fil.

Åbn hjemmesiden(Open the homepage) for denne tjeneste. Derefter skal du trække og slippe PDF - filer eller bruge knappen UPLOAD FILER(UPLOAD FILES) . Hver uploadet PDF -fil konverteres automatisk til XLSX-formatfil. Når outputfilerne er klar, kan du downloade dem én efter én eller downloade en ZIP -fil, der vil indeholde alle outputfilerne.

2] PDFtoExcel.com

Uddrag tabeller fra PDF-dokumenter

PDFtoExcel.com -tjenesten kan udtrække tabeller fra én PDF på én gang, men den understøtter flere platforme til at uploade PDF . Det understøtter OneDrive , desktop , Google Drive og Dropbox platforme til at uploade en PDF . Konverteringsprocessen er også automatisk.

Denne servicehjemmeside er her(here) . Der skal du vælge en uploadindstilling for at tilføje PDF . Derefter uploader og konverterer den automatisk PDF til Excel ( XLSX ) fil. Når outputtet er klar, får du downloadlinket for at gemme outputfilen, der indeholder PDF - tabeller.

Bemærk:(Note: ) Selvom denne tjeneste nævner, at den også kan udtrække tabeller fra scannede PDF - filer, virkede den ikke for mig. Du kan stadig prøve det til scannet PDF .

3] Tabula

Tabula PDF-udtrækssoftware

Tabula er en kraftfuld software, der automatisk kan registrere tabeller, der findes i en PDF , og derefter lader dig gemme disse tabeller som TSV , JSON eller CSV -fil. Du kan vælge muligheden for at gemme separate CSV - filer for hver PDF - tabel eller gemme alle tabellerne i en enkelt CSV -fil.

For at downloade denne open source PDF-tabeludtrækker, klik her(click here) . Det kræver også, at Java(requires Java) kan køre og bruge det med succes.

Udpak ZIP -filen, som du downloadede, og kør filen tabula.exe . Det åbner en side i din standardbrowser. Hvis siden ikke er åbnet, skal du tilføje http://localhost:8080 i din browser og trykke på Enter .

Nu vil du se dens grænseflade, hvor du kan bruge indstillingen Gennemse(Browse) til at tilføje en PDF . Tryk derefter på knappen Importer(Import) . Når PDF'en(PDF) er tilføjet, kan du se PDF -sider på dens grænseflade.

Brug knappen Automatisk registrering af tabeller(Autodetect Tables) , og den vil automatisk fremhæve alle de tabeller, der findes i den pågældende PDF . Du kan også manuelt fremhæve en tabel ved at vælge en bestemt tabel. Hvis du vil, kan du også fjerne udvalgte tabeller(remove selected tables) efter eget valg.

Dette vil hjælpe dig med at gemme kun de tabeller, du ønsker. Når PDF - tabeller er fremhævet, skal du klikke på Preview & Export Extracted Data- knappen.

Til sidst skal du bruge rullemenuen i den øverste del til at vælge et outputformat og trykke på knappen Eksporter(Export) . Dette vil gemme PDF -tabeller i outputformatfilen, som du har valgt.

4] ByteScout PDF-multiværktøj

ByteScout PDF Multitool - tilføj pdf og find tabeller

Som navnet antyder, kommer denne software med flere værktøjer. Det har værktøjer såsom konvertere PDF til flersidet TIFF(convert PDF to multipage TIFF) , rotere PDF-dokument(rotate PDF document) , gøre PDF usøgeligt(make PDF unsearchable) , optimere PDF(optimize PDF) , tilføje et billede til PDF(add an image to PDF) og mere. PDF -borddetektorfunktion er der også, hvilket er ret fantastisk. Fordelen ved dette værktøj er, at du også kan udtrække tabeller fra scannet PDF(extract tables from scanned PDF) . Du kan finde tabeller på flere sider og derefter udtrække disse tabeller som CSV- , XLS- , XML- , TXT- eller JSON -formatfiler. Før udtrækning giver den dig også mulighed for at indstille et sideområde(page range)kun at udtrække tabeller fra specificerede sider.

Du kan få fat i denne software her(here) . Det er kun gratis til ikke-kommerciel brug(free for non-commercial use) . Efter installationen skal du køre denne software og bruge indstillingen Åbn dokument(Open Document) til at tilføje en PDF . Klik derefter på værktøjet Find tabeller(Detect tables) som fremhævet på billedet ovenfor. Dette værktøj er til stede under kategorien Dataekstraktion(Data Extraction) .

Det åbner en boks, hvor du kan indstille betingelser for at finde tabeller. Du kan f.eks. indstille et minimumsantal af kolonner, rækker, minimumslinjeskift mellem tabeller, indstille tabelregistreringstilstand til tabel med kant eller kant, osv. Brug indstillinger eller behold standardindstillingerne.

Tryk derefter på knappen Find næste tabel(Detect next table) i det felt. Den identificerer og vælger en tabel på den aktuelle side. På den måde kan du flytte til en anden side og finde flere tabeller.

opdage tabeller og gem pdf-tabeller med valgt output

Når du er færdig, skal du bruge knappen Fortsæt til udtræk(Proceed to extraction) og vælge outputformatet. Endelig kan du bruge muligheder til at gemme tabellerne fra den aktuelle side eller definere et sideområde og gemme outputtet.

Værktøjet giver et tilfredsstillende output. Men nogle gange kan det finde andet indhold i PDF og muligvis ikke udtrække tabeller fra flere sider. I så fald bør du bruge det til at hente og gemme tabeller én efter én.

5] Sejda PDF Desktop

Sejda PDF Desktop med pdf til excel konverter

Sejda PDF Desktop er også en multifunktionel software. Den kan optimere eller komprimere PDF(compress PDF) , tilføje vandmærke til PDF, fjerne begrænsninger fra PDF(remove restrictions from PDF) , redigere PDF- dokument osv. Dens gratis plan har dog begrænsninger. I den gratis plan kan der kun udføres 3 opgaver om dagen. Desuden er grænsen for PDF- størrelse 50 MB eller 10 sider(10 pages) .

Du kan bruge dets PDF til Excel(PDF to Excel) konverteringsværktøj til at udtrække PDF- tabeller. Den registrerer automatisk tabellerne i PDF- sider og lader dig gemme disse tabeller som XLSX eller CSV .

Dens downloadlink er her(here) . Efter installationen skal du bruge PDF til Excel -værktøjet fra dets hovedgrænseflade. Når du har valgt dette værktøj, skal du bruge knappen Vælg PDF-filer(Choose PDF files) . Kun én PDF kan tilføjes til den gratis plan.

Når PDF'en(PDF) er tilføjet, vil den give Konverter PDF til CSV(Convert PDF to CSV) og Konverter PDF til Excel(Convert PDF to Excel) knapper. Brug en knap, og så kan du gemme outputtet til den ønskede placering på din pc.

konverter pdf-tabel til excel eller csv

Dets PDF -tabeldetektionsværktøj er godt. Du behøver ikke at registrere tabeller manuelt. Alligevel kan det nogle gange inkludere andet tekstindhold som en PDF -tabel og gemme det i outputtet. Men overordnede resultater er gode.

Det er alt.

Disse er nogle gode værktøjer til at udtrække tabeller fra PDF . Tabula -software er mere effektiv end andre værktøjer. Alligevel kan du prøve alle værktøjerne og se, hvilke der hjælper.

Lignende lyder:(Similar reads:)



About the author

Efter næsten 20 år i teknologibranchen har jeg lært meget om Apple-produkter, og hvordan man kan tilpasse dem til mine behov. Især ved jeg, hvordan jeg bruger iOS-platformen til at skabe brugerdefinerede udseender og interagere med mine brugere gennem applikationspræferencer. Denne oplevelse har givet mig værdifuld indsigt i, hvordan Apple designer sine produkter, og hvordan man bedst kan forbedre deres brugeroplevelse.



Related posts