5 gratis online OCR-tjenester testet og gennemgået

Har du et PDF -dokument eller et billede, som du gerne vil konvertere til tekst? For nylig sendte nogen mig et dokument med posten, som jeg skulle redigere og sende tilbage med rettelser. Personen kunne ikke finde en digital kopi, så jeg fik til opgave at få al den tekst til digitalt format.

Der var ingen måde, jeg ville bruge timer på at skrive alt ind igen, så jeg endte med at tage et flot billede af høj kvalitet af dokumentet og derefter brændte mig igennem en masse online OCR - tjenester for at se, hvilken der ville give mig den bedste resultater.

I denne artikel vil jeg gennemgå et par af mine yndlingswebsteder til OCR , der er gratis. Det er værd at bemærke, at de fleste af disse websteder tilbyder en grundlæggende gratis service og derefter har betalingsmuligheder, hvis du ønsker ekstra funktioner som større billeder, flersidede PDF - dokumenter, forskellige inputsprog osv.

Det er også godt at vide på forhånd, at de fleste af disse tjenester ikke vil kunne matche formateringen af ​​dit originale dokument. Disse er primært til at udtrække tekst, og det er det. Hvis du har brug for at alt skal være i et bestemt layout eller format, bliver du nødt til at gøre det manuelt, når du får al teksten fra OCR .

Derudover vil de bedste resultater for at få teksten komme fra dokumenter med en opløsning på 200 til 400 DPI . Hvis du har et lavt DPI -billede, bliver resultaterne ikke så gode.

Endelig var der en masse websteder, jeg testede, som bare ikke virkede. Hvis du Googler gratis online OCR , vil du se en masse websteder, men flere af webstederne i top 10 resultater fuldførte ikke engang konverteringen. Nogle ville time-out, andre ville give fejl og nogle satte sig bare fast på "konverteringssiden", så jeg gad ikke engang at nævne disse sider.

For hvert websted testede jeg to dokumenter for at se, hvor godt outputtet ville være. Til mine test brugte jeg simpelthen min iPhone 5S til at tage et billede af begge dokumenter og uploadede dem derefter direkte til hjemmesiderne til konvertering.

Hvis du vil se, hvordan billederne så ud, som jeg brugte til min test, har jeg vedhæftet dem her: Test1 og Test2 . Bemærk, at disse ikke er versionerne i fuld opløsning af billederne taget fra telefonen. Jeg brugte billedet i fuld opløsning, når jeg uploadede til webstederne.

OnlineOCR

OnlineOCR.net er en ren og enkel side, der leverede meget gode resultater i min test. Det vigtigste, jeg godt kan lide ved det, er, at det ikke har tonsvis af annoncer overalt, hvilket normalt er tilfældet med den slags nicheservicewebsteder.

gratis online ocr

For at starte skal du vælge din fil og vente, indtil den er færdig med at uploade. Den maksimale uploadstørrelse for dette websted er 100 MB. Hvis du tilmelder dig en gratis konto, får du et par ekstra funktioner som den større uploadstørrelse, flersidede PDF'er(PDFs) , forskellige inputsprog, flere konverteringer i timen osv.

Vælg derefter dit inputsprog og vælg derefter outputformatet. Du kan vælge mellem Word , Excel eller almindelig tekst(Plain Text) . Klik(Click) på knappen Konverter(Convert) , og du vil se teksten vist nederst i en boks sammen med et downloadlink.

ocr output

Hvis alt du vil have er teksten, skal du bare kopiere og indsætte den fra boksen. Jeg foreslår dog, at du downloader Word- dokumentet, fordi det gør et overraskende godt stykke arbejde med at bevare det originale dokuments layout.

For eksempel, da jeg åbnede Word -dokumentet til min anden test, blev jeg overrasket over at opdage, at dokumentet indeholdt en tabel med tre kolonner, ligesom på billedet.

online ocr output

Ud af alle webstederne var denne den bedste langt. Det er absolut værd at registrere sig for, hvis du skal lave mange konverteringer.

For fuldstændighedens skyld vil jeg også linke til outputfilerne, der er oprettet af hver tjeneste, så du selv kan se resultaterne. Her er resultaterne fra OnlineOCR : Test1 Doc og Test2 Doc .

Bemærk, at når du åbner disse Word -dokumenter på din computer, får du en besked i Word om, at det er fra internettet(Internet) , og at redigering er blevet deaktiveret. Det er helt OK, fordi Word ikke har tillid til dokumenter fra internettet(Internet) , og du behøver virkelig ikke at aktivere redigering, hvis du bare vil se dokumentet.

i2OCR

Et andet websted, der gav ret gode resultater, var i2OCR . Processen ligner meget: Vælg dit sprog, din fil, og tryk derefter på Udpak tekst(Extract Text) .

i2ocr

Du bliver nødt til at vente et minut eller to her, fordi denne side tager lidt længere tid. I trin 2(Step 2) skal du også sørge for, at dit billede vises med højre side opad i forhåndsvisningen, ellers får du en masse sludder som output. Af en eller anden grund blev billederne fra min iPhone vist i portrættilstand på min computer, men liggende, da jeg uploadede til dette websted.

i2ocr output

Jeg var nødt til manuelt at åbne billedet i en fotoredigeringsapp, rotere det 90 grader, derefter rotere det tilbage til portræt og derefter gemme det igen. Når(Once) du er færdig, skal du rulle ned, og den vil vise dig en forhåndsvisning af teksten sammen med en downloadknap.

Dette websted klarede sig ret godt med outputtet for den første test, men klarede sig ikke så godt med den anden test, der havde kolonnelayoutet. Her er resultaterne fra i2OCR: Test1 Doc og Test2 Doc .

GratisOCR

Free-OCR.com vil tage dine billeder og konvertere dem til almindelig tekst. Det har ikke en mulighed for at eksportere til Word -format. Vælg din fil, vælg et sprog, og klik derefter på Start .

Siden er hurtig, og du får output ret hurtigt. Bare(Just) klik på linket for at downloade tekstfilen til din computer.

freeocr

Som med NewOCR nævnt nedenfor, bruger denne side alle T'erne i dokumentet med store bogstaver. Jeg aner ikke, hvorfor det ville gøre det, men af ​​en eller anden mærkelig grund gjorde dette websted og NewOCR begge dette. Det er ikke en stor sag at ændre på det, men det er en kedelig proces, du virkelig ikke skal gøre.

Her er resultaterne fra FreeOCR: Test1 Doc og Test2 Doc .

ABBYY FineReader Online

For at bruge FineReader Online skal du oprette en konto, som giver dig en 15-dages gratis prøveperiode til OCR op til 10 sider gratis. Hvis du kun skal lave en engangs- OCR for et par sider, så kan du bruge denne service. Sørg(Make) for, at du klikker på bekræftelseslinket i bekræftelsesmailen, efter du har registreret dig.

finereader online

Klik på Genkend(Recognize) øverst, og klik derefter på Upload for at vælge din fil. Vælg dit sprog, outputformat, og klik derefter på Genkend(Recognize) nederst. Dette websted har en ren grænseflade og ingen annoncer også.

I mine test kunne denne side fange teksten fra det første testdokument, men det var helt enormt, da jeg åbnede Word - dokumentet, så jeg endte med at gøre det igen og vælge almindelig tekst(Plain Text) som outputformat.

Til den anden test med kolonnerne var Word - dokumentet tomt, og jeg kunne ikke engang finde teksten. Ikke sikker på, hvad der skete der, men det ser ikke ud til at kunne håndtere andet end simple afsnit. Her er resultaterne fra FineReader: Test1 Doc og Test2 Doc .

Ny OCR

Det næste websted, NewOCR.com , var OK, men ikke nær så godt som det første websted. For det første har den annoncer, men heldigvis ikke et ton. Du vælger først din fil og klikker derefter på Preview - knappen.

upload billede

Du kan derefter rotere billedet og justere det område, hvor du vil scanne for tekst. Det er stort set ligesom, hvordan scanningsprocessen fungerer på en computer med en tilsluttet scanner.

ocr billede

Hvis dokumentet har flere kolonner, kan du kontrollere knappen Sidelayoutanalyse,( Page layout analysis) og det vil forsøge at dele teksten op i kolonner. Klik(Click)OCR- knappen, vent et par sekunder på, at den er fuldført, og rul derefter ned til bunden, når siden opdateres.

I den første test fik den al teksten korrekt, men af ​​en eller anden grund blev hvert T i dokumentet skrevet med stort! Ingen anelse om hvorfor det ville gøre det, men det gjorde det. I den anden test med sideanalyse aktiveret fik den det meste af teksten, men layoutet var helt slukket.

Her er resultaterne fra NewOCR: Test1 Doc  og Test2 Doc .

Konklusion

Som du kan se, giver gratis dig ikke rigtig gode resultater det meste af tiden desværre. Det første nævnte websted er langt det bedste, fordi det ikke kun gjorde et godt stykke arbejde med at genkende al teksten, det formåede også at bevare formatet af det originale dokument.

Hvis du bare har brug for tekst, burde de fleste af hjemmesiderne ovenfor dog kunne gøre det for dig. Hvis du har spørgsmål, er du velkommen til at kommentere. God fornøjelse!



About the author

Jeg er professionel computertekniker og har over 10 års erfaring inden for området. Jeg har specialiseret mig i Windows 7 og Windows Apps udvikling, samt Cool Websites design. Jeg er ekstremt vidende og erfaren på området, og vil være et værdifuldt aktiv for enhver organisation, der ønsker at vokse deres forretning.



Related posts