Anonim

En av de saker som ofta har frustrerat mig är oförmågan att enkelt kopiera text från bilder och vissa PDF-filer (t.ex. de som kan ha skapats från skannade dokument). Tack och lov har mjukvarulösningar med tiden utvecklats för att lösa problemet, vilket möjliggör betydande tidsbesparingar som annars skulle ha använts manuellt på att kopiera och skriva om texten. I dagens tips kommer jag att prata om ett gratis programverktyg som heter Capture2Text som använder en OCR-algoritm (Optical Character Recognition) som gör att du kan fånga text från bild- och PDF-filer.

Installation och installation

För att börja, gå vidare till projektets SourceForge-sida och ladda ner den senaste versionen av Capture2Text. Programvaran kommer som ett zip-arkiv och inkluderar för närvarande inte en dedikerad installerare. När du har laddats ner packar du upp arkivet och startar filen Capture2Text.exe. Detta startar programvaran och lägger ned en ikon i systemfältet:

Först, vad du vill göra är att konfigurera programvarans preferenser, specifikt vilka snabbtangenter (eller genvägar) som ska användas för att starta och stoppa inspelning:

I mitt fall har jag valt att använda "Windows + q" -tangenterna för att börja fånga och "Enter" för att stoppa det. Du kan justera dessa alternativ till det som fungerar bäst för dig. Kom ihåg att tangenten “Windows + s” ofta används för skärmdumpning redan (t.ex. av program som Microsoft One Note).

På nästa flik kan OCR-alternativ konfigureras inklusive ingångsspråket (för närvarande stöds sju språk) och om man vill använda OCR-förbehandling för att förbättra noggrannheten (rekommenderas starkt). Slutligen kan man på fliken Output bland annat välja om man bara vill spara den fångade texten på urklippet eller om man vill starta ett separat popup-fönster.

Använda programvaran

När programvaran har installerats och konfigurerats kan du börja använda den via din snabbtangentkombination för startupptagning. Välj med musen det område på bilden som innehåller texten du vill fånga. För att stoppa inspelningen, tryck bara på den snabbtangent som du har valt för att stoppa inspelningen. Texten kopieras sedan antingen till Urklipp, ett popup-fönster eller båda. Ett exempel kan ses nedan.

Från min snabbtestning av verktyget med bilder har jag funnit att dess noggrannhet är anständig. Uppenbarligen finns det begränsningar för verktyg som detta och OCR i allmänhet. Till exempel kan kraftigt modifierad text (mycket kursiv, kursiv eller modern) kanske inte fungera lika bra, och ibland inte alls. I vissa fall kommer det också att hjälpa till att justera fångstboxens dimensioner något eller spela med zoomen på själva bilden för att få ett mer exakt resultat.

När du fångar in text från skannade PDF-dokument är noggrannheten ok, med några slutliga ändringar som i allmänhet fortfarande är nödvändiga för den fångade utgången (beroende på kvaliteten på den inledande skanningen). Jag har också lagt märke till att programvaran kan ta några sekunder längre tid att bearbeta, särskilt när man blir ombedd att konvertera stora mängder text.

Att allt sägs, överhuvudtaget tycker jag att verktyget gör ett bra jobb, särskilt eftersom det är fritt tillgängligt - jag uppmuntrar dig att prova det.

Tillägg 11/16/2015:

Som ett annat alternativ, för de som har Google-konton, är det också möjligt att använda Googles OCR-funktioner genom att ladda upp en fil till din Google Drive (mer information finns här). Dessutom finns det en OCR-plugin tillgängligt för Google Chrome-användare som heter Copyfish som du kanske vill kolla in.

Hur man fångar text från bilder med ocr-programvara