ABBYY Finereader Express 8.4: känna igen text från någon källa i farten (distribution kod avslutade)
Makradar Teknik / / December 19, 2019
Digitalt innehåll och elektroniska versioner av dokument omger oss på alla sidor. Papper i våra liv är nästan inget utrymme kvar. Tidningar och tidskrifter har flyttat in i online-format i boken vi läst på e-bläck läsare eller tablett, har vanliga brev ersatt e-post och sms. Men ibland måste vi att mixtra med de första tidningarna att få dem en elektronisk kopia. Här kommer vi till hjälp av särskilda program som använder OCR-teknik för att OCR-text (Optical Character Recognition). Den mest kända av dessa är utan tvekan ABBYYFineReader. Du kan använda den för att konvertera pappersdokument till redigerbara format och spara PDF till sökbar text. Och idag har vi ett utmärkt tillfälle att lära sig mer om det.
* * *
För Mac ABBYY erbjuder endast Finereader Express, ändå har den nödvändiga funktioner. De viktigaste funktionerna i ABBYY Finereader Express är ett erkännande noggrannhet och behålla layout, stöd för många språk (171 språk till de tre språken i en dokument), omvandling och skapandet av PDF (PDF konvertering till redigerbara format), redaktör för områden manuell märkning (text, bord, bilden) och ett enkelt och användarvänligt gränssnitt program.
första titt
Finereader Express drift fönstret är ganska minimalistisk, det finns bara de mest nödvändiga sakerna. Sidopanelen innehåller skisser läggas sidor och isntrumentov panelens knappar med listrutor för att välja språk och utdatafilen. Fortfarande finns det konvertering och zoomknappen. Annars gränssnitt motsvarar en snabb express version som satsning på automatisk körning av verksamheten med ett minimum av konfiguration och användardeltagande.
Klara proven
Efter lanseringen Reader möter oss en kompakt fönster med ett urval av scenario. Här är vi uppmanas att välja capture källa: scanner, fax, eller läsa från en fil. Det är också lämpligt att ange ett dokument språk (eller språken, om mer än en) - det kommer att bidra till att förbättra erkännandet noggrannhet originaldokumentet. Jo, faktiskt produktionen filformatet är allt enkelt - välj baserat på typen av pappersdokument.
Scanner till hands jag inte ha, men det är ännu bättre - att använda som källa för fotot Tillverkad med hjälp av iPhone, komplicerat jag uppgiften att känna igen text. Som ett exempel på texten, tog jag en av böckerna av sin hustru, samt ett exempel på bordet - några gamla arbets film sändning av iPhone. Nåväl, låt oss komma igång.
Varje sida med text
I brist på en scanner som jag gjorde bara en bok tur foton - foto normal rumsbelysning, ingen stativ och andra tweaks. Här är den ursprungliga:
Låt oss se vad det kan göra med Finereader. Vi anger att vi vill dra in foto text, ange det språk som ryska och starta processen.
Till sin kredit, måste ansökan sägas att hela texten definierades, inklusive misstag fick böja intilliggande sida. En bit av den tabell, som jag specifikt kvar i ramen, definierad som den förväntade bilden. Men det är inte skrämmande, eftersom vi kan manuellt ändra domänen anger sitt slag (om programmet inte är korrekt inställd) och ta bort fältet erkännande som krävs. Alla manipulationer tog mig mindre än en minut, men i slutändan fick jag här är en helt acceptabelt resultat:
Efter en kort korrekturläsning och redigeringar i dokumentet är klar. Jag tror att detta är ett bra resultat för en sådan snabb, nästan automatiskt erkännande process.
känna igen tabell
Som en experimentell bord tjänar opretentiös lagförslag, som också filmades på iPhone. Det finns redan i bruk Ukrainska (tillsammans med check språkstöd), som också är bra för vår erfarenhet. Att välja ett nytt skript (⌘N) Ange källan - läs från en fil, språket - ukrainska och fil utgång - bord.
Programmet tänker några sekunder, och här har vi resultatet:
Med bordet programmet inte hanteras så bra, men det är mer eller mindre acceptabelt, i princip, att texten i definition, såvida detta inte beror avsluta celler som inte fanns i det ursprungliga dokumentet. Det kommer att mixtra lite längre tid att få den slutliga utformningen av kartan dokument, men det är lättare än att skriva ett tecken med handen från grunden.
Spara till PDF
När du sparar till PDF programmet tyvärr inte förbättrar den ursprungliga bilden (kontrast, ljusstyrka) och den placeras i PDF-dokumentet som är. Men desto mindre söktexten är närvarande, och det är bra.
resultera
Precis som alla verktyg, har Finereader sina för- och nackdelar. De starka punkter, utöver de angivna egenskaperna hos tillverkaren, är att OCR tabeller och fungerar ganska bra, och konvertera till PDF, som utlovat, sök stöd text. Nackdelen är bristen på alternativ och mycket knappa medel för att manuellt styra processen. Men detta är delvis berättigad, det faktum att det finns en uttrycklig version och det fungerar automatiskt.
Koder för Finereader Express program vann Gregory Ushar och Nikolai Blinov. Grattis! Läsa dina meddelanden skickade koder.