Moduły systemu FormAnalyzer:
FA Database; FA Scan&Amin; FA
Designer; FA Production Manager; FA Engine; FA Verifier; FA
Export
System
FormAnalyzer współpracuje z oprogramowaniem Stellent
Imaging, Business Process Management, Stellent Universal Content
Management jak również ze wszystkimi produktami, które
pobierają i przetwarzają dane zawierające wyniki rozpoznania
formularzy wraz z ich obrazami.
System
FormAnalyzer
jest modularnym systemem informatycznym przeznaczonym do
automatyzacji przetwarzania formularzy z postaci papierowej do
elektronicznych danych tekstowych odzwierciedlających zawartość
pól formularza.
System umożliwia
skanowanie, rozpoznawanie oraz weryfikację i symbolizację
zeskanowanych formularzy.
Za pomocą systemu
można przetwarzać dokumenty o
zdefiniowanym uprzednio układzie pól
i dowolnej liczbie
stron. Dokumenty mogą zawierać dowolne załączniki nie
zawierające pól rozpoznawanych. Wykorzystanie technologii
rozpoznawania znaków ICR/OCR umożliwia rozpoznawanie treści
dokumentów wypełnionych za pomocą pisma drukowanego lub pisma
ręcznego blokowego. Dokumenty mogą również zawierać kody
kreskowe i wypełniane ręcznie pola wyboru.
Możliwe jest przetwarzanie różnych
rodzajów formularzy w jednym wsadzie w dowolnej kolejności.
Poszczególne typy dokumentów (formularzy) są rozpoznawane
po układzie pól i sortowane automatycznie.
System składa się z
następujących modułów:
-
FormAnalyzer
Designer;
-
FormAnalyzer
Scan & Administrator;
-
FormAnalyzer
Production Manager;
-
FormAnalyzer
Engine (OCR/ICR BarCode);
-
FormAnalyzer
Verifier;
-
FormAnalyzer
Database;
-
FormAnalyzer
Export.
Liczba
i rodzaj modułów jest dobierana w zależności od potrzeb
użytkowników takich jak wymagana przepustowość systemu czy cechy
charakterystyczne formularzy.
Dokumenty –
skanowane lub importowane z plików – są przechowywane przez
moduł FormAnalyzer Database. Relacyjna baza danych (Sybase SQL
Anywhere) służy do przechowywania opisów dokumentów, np. daty i
czasu utworzenia, osoby wprowadzającej dokument do systemu, typu
dokumentu i rozpoznanej lub wprowadzonej ręcznie treści
dokumentu. Zapewnia ona właściwą synchronizację między modułami
FormAnalyzer, ochronę i integralność danych. Obrazy stron
dokumentów są przechowywane na wolumenach – folderach systemu
plików przeznaczonych do tego celu.
Typowy schemat
przetwarzania dokumentów składa się z czterech etapów:
1.
Wprowadzenia dokumentów do systemu
Ten etap jest
realizowany przez FormAnalyzer Scan&Administrator. Dokumenty
mogą być skanowane lub importowane z plików graficznych. Już na
tym etapie może być dokonywana wstępna obróbka dokumentów:
usuwanie przekrzywienia stron, poprawa jakości obrazu,
rozpoznawanie typu formularza na podstawie kodów kreskowych.
2. Automatycznego
rozpoznania treści dokumentów
Za rozpoznawanie
treści dokumentów jest odpowiedzialny moduł FormAnalyzer Engine.
Korzystając z opisów sposobu rozpoznawania treści dokumentów
znajdujących się w bazie danych FormAnalyzer (tzw. plików
konfiguracyjnych przygotowanych w FormAnalyzer Designer)
automatycznie rozpoznaje treść dokumentu. Program umożliwia
automatyczne sprawdzenie poprawności i korektę niepoprawnych
danych. Wyniki rozpoznawania – treść dokumentu – są zapisywane w
bazie danych FormAnalyzer.
3. Weryfikacji
poprawności automatycznie rozpoznanych danych
Weryfikacja
poprawności treści dokumentów jest najbardziej czasochłonnym
etapem przetwarzania dokumentów. Jest ona wykonywana przez
operatorów weryfikacji korzystających z modułu FormAnalyzer
Verifier. W zależności od rodzaju dokumentów, istotności danych
i wymagań dotyczących jakości danych proces weryfikacji może
przebiegać odmiennie (obieg dokumentów jest projektowany w
FormAnalyzer Production Manager). Z jednej strony dokumenty mogą
być weryfikowane automatycznie, tzn. trafiać do systemów
zewnętrznych bez udziału operatorów. Z drugiej strony – przy
ważnych danych – ten sam dokument może być weryfikowany
niezależnie przez dwie różne osoby, a w przypadku stwierdzenia
różnic w treści po weryfikacji przez trzecią osobę.
W ramach jednego
systemu dokumenty mogą podlegać różnym sposobom weryfikacji –
decyzje są podejmowane na podstawie typu dokumentu oraz jego
treści.
Także w obrębie
samego dokumentu różne pola mogą być sprawdzane odmiennie:
niektóre, o ile tylko spełniają kryteria walidacji, nie będą
pokazywane operatorom weryfikacji; inne, niezależnie od innych
czynników, będą musiały być wprowadzone dwa razy (oczywiście tak
samo).
Wszystkie te
mechanizmy służą do znalezienia optymalnej równowagi między
jakością danych po weryfikacji a czasem poświęconym na
weryfikację.
4. Eksportu danych
do systemów zewnętrznych
Zakończeniem
procesu przetwarzania dokumentów jest przekazanie ich treści do
systemów zewnętrznych, które wykonują dalsze przetwarzanie tych
danych. Ten krok jest wykonywany przez FormAnalyzer Eksport.

Przykładowa
konfiguracja systemu FormAnalyzer