piątek, 3 września 2010

Oracle Form Recognition – informacje o produkcie

Michał Szkopiński

Oracle Forms Recognition jest narzędziem do automatycznego rozpoznawania i klasyfikowania praktycznie każdego typu dokumentu, w tym faktur, zamówień, weksli towarowych czy paragonów. Na zeskanowanym dokumencie OFR potrafi rozpoznać dowolny rodzaj informacji, przy czym w odróżnieniu od innych rozwiązań ekstrakcji danych, rozwiązanie Oracle nie wymaga tworzenia szablonów dokumentów.

Analizowanie dokumentu w poszukiwaniu niezbędnych informacji jest wykonywane inteligentnie przy użyciu mechanizmów uczących się. Wszystko, co jest wymagane do poprawnej pracy systemu to wprowadzenie niewielkiej próbki dokumentów, które będą stanowić bazę dla systemu uczącego się. Oracle Forms Recognition uczy się na podstawie tej próbki rozpoznawać kolejne nadchodzące dokumenty, co pozwala na identyfikację i klasyfikowanie nowych, często innych w swoim formacie niespodziewanych zawartości bez interwencji człowieka. W związku z tym, system ten potrafi automatycznie znaleźć w dokumencie oczekiwane wartości pól, lokalizując je samodzielnie.

To właśnie ta funkcjonalność decyduje o sile tego produktu czyniąc go inteligentnym systemem do rozpoznawania teksu. Nawet jeśli dostawca faktur zmieni rozkład danych czy po prostu zmieni się ilość produktów na fakturze, to OFR będzie w stanie odczytać wszystkie niezbędne informacje. Dodatkowo nawet jeśli sam dokument papierowy zostanie krzywo zeskanowany to OFR bez problemów znajdzie interesujące go dane.

Kolejnym etapem w procesie rozpoznawania danych, jest dostarczenie pliku dokumentu wraz z wyekstrahowanymi danymi do repozytorium Oracle Universal Content Management (UCM). Integracja między OFR a UCM jest dostępna w produkcie i wymaga jedynie konfiguracji, a nie dodatkowych modułów programistycznych.


Przykładowy proces obiegu dokumentów



Rysunek nr 1 przedstawia typowy proces przetwarzania dokumentów papierowych, które podlegają rejestracji, skanowaniu, rozpoznawaniu tekstu oraz obiegowi w procesie biznesowym. Pierwszym krokiem jest zawsze rejestracja dokumentu przychodzącego poprzez zeskanowanie go przy użyciu oprogramowania Oracle Document Capture lub Oracle Distributed Document Capture (ODC/ODDC). Następnie dokument już w formie elektronicznej zostaje przesłany do systemu centralnego, gdzie podlega klasyfikacji i ekstrakcji danych w aplikacji Oracle Forms Recognition. Po automatycznym rozpoznaniu wszystkich wymaganych danych, OFR zapisuje zarówno zeskanowany plik jak i rozpoznane wartości w repozytorium treści, jakim jest Oracle Universal Content Management (UCM). Od tego momentu rozpoczyna się właściwy proces biznesowy, który inicjalizowany jest właśnie przychodzącym dokumentem. System Business Process Management (BPM) wraz z towarzyszącym mu portalem internetowym zapewnia właściwe przetwarzanie dokumentu w dziedzinowym systemie ERP. Kolejni pracownicy merytoryczni dostają zadania przydzielane przez system w celu akceptacji i weryfikacji poprawności danych. Ostatecznie proces kończy się zgodnie z wytycznymi biznesowymi, przy czym dokument pozostaje w repozytorium w celach archiwalnych i raportowych. Oczywiście, właściwa implementacja procesu jest dopasowywana do biznesowych wymagań każdego przedsiębiorstwa.

Podsumowanie

Jak widać z powyższego opisu, Oracle Forms Recognition idealnie wpisuje się w koncepcję automatyzacji obiegu dokumentów z wykorzystaniem inteligentnego mechanizmu rozpoznawania tekstu oraz modułu uczącego się. To narzędzie może znaleźć zastosowanie do przetwarzania praktycznie każdego rodzaju dokumentu, bez względu na jego zawartość. Wraz z innymi produktami firmy Oracle z pakietu Fusion Middleware – takimi, jak Oracle BPM, Oracle UCM czy Oracle DC, dostarcza kompletne rozwiązanie do skanowania i przetwarzania nawet najbardziej skomplikowanych procesów biznesowych z udziałem powiązanych ze sobą dokumentów papierowych i elektronicznych.

Autor artykułu pracuje w Oracle Polska jako Senior Sales Consultant.

Napisz do autora:

Michal.Szkopinski@oracle.com


Brak komentarzy:

Prześlij komentarz