Azure

Azure Cognitive Service의 Form Recognizer 사용해 보기

whistory 2023. 6. 23. 13:27
반응형

 

 

Azure Cognitive Service인 Form Recognizer 사용해본다.

 

 

구버전 tool

 

Form OCR Testing Tool

 

fott.azurewebsites.net

 

신버전 tool

 

 

Form Recognizer Studio - Microsoft Azure

 

formrecognizer.appliedai.azure.com

 

 

 

 

여기서는 새로운 버전을 사용해본다.

이유는 제일 아래...

 

1. 프로젝트 생성

Form Recognizer Studio 아래쪽으로 이동하면 [Custmo models] - [Create new] 버튼으로 프로젝트 생성화면으로 이한다.

 

[Create a project] 버튼으로 새로운 프로젝트를 생성한다.

 

프로젝트 정보들을 입력해준다.

 

리소스를 입력해준다.

 

한국리전에서 생성한 리소스는 Neral model을 사용할 수 없다.

하지만 난 Template model을 사용할 것이라 상관없다.

 

프리뷰 버전보다는 GA버전을 사용한다.

데이터소스를 지정한다.

 

정상적으로 Azure Blob Storage에 연결되면,

해당 경로에 업로드 된 파일들이 자동으로 로드 된다.

 

 

2. Labeling

우측 [Add a filed] 를 눌러 라벨링할 항목과 타입을 지정한다.

 

[Run layout] 을 통해 Layout을 인식 한다.

 

인식이 된 항목들에 색상을 가진 라운드 박스가 생성된다.

 

라벨링 하고 싶은 부분을 클릭하면 녹색 라운드박스로 변경되고,

설정할 라벨을 선택한다.

 

진한 빨간색의 성명에 맵핑하였기 때문에, 화면의 성명에 진한 빨간색의 라운드박스가 그려진다.

라벨링을 완료한 상태

 

3. Train

💡Train 이란?

Azure Form Recognizer에서 "Train"은 커스텀 모델을 학습시키는 작업을 의미합니다.
커스텀 모델은 특정 문서 유형 또는 특정 데이터 세트에 대한 지능적인 문서 분석을 수행하는 데 사용되는 모델입니다.

커스텀 모델을 훈련시키려면 Form Recognizer 서비스에 대상 문서를 제공하고, 학습 데이터 세트를 구성하여 양식의 구조와 필드를 정의해야 합니다.
그런 다음 Form Recognizer는 제공된 데이터를 기반으로 훈련하여 커스텀 모델을 생성합니다.

훈련된 커스텀 모델은 특정 유형의 문서를 분석하고 필드를 추출하는 데 사용됩니다.
커스텀 모델을 사용하여 문서를 분석하면, 기본 모델보다 정확도가 더 높은 결과를 얻을 수 있습니다.
또한 커스텀 모델을 업데이트하거나 추가 학습을 수행하여 모델의 성능을 개선할 수도 있습니다.

따라서 "Train"은 Form Recognizer에게 특정 유형의 문서를 학습시켜 해당 유형의 문서를 인식하고 필드를 추출할 수 있는 커스텀 모델을 생성하는 작업을 의미합니다.

 

5개 이상의 파일의 라벨링을 하면, 우측 상단의 [Train] 버튼이 활성화된다.

[Train] 을 눌러 custom model을 생성한다.

[Auto label] 을 실행하고, Train 한 Model을 선택하면, 자동으로 라벨링이 진행된다.

 

 

4. Test

Train을 완료했으면, 좌측의 [Test] 메뉴에서 테스트를 진행 해 본다.

파일을 추가하고, [Run analysis] 를 클릭하면, 라벨링이 진행되고, confidence 값을 확인 할 수 있다.

 

5. Share project

생성한 프로젝트를 다른 사람과 함께 공유하고 싶다면,

[Share] 버튼을 눌러 project token을 복사한다.

공유 받은 project token을 입력하면, 해당 project를 같이 사용 할 수 있다.

 

 

 

 

6. 추가

신버전을 사용하는 이유는

구버전에서 selection mark 인식률이 매우 좋지 않았기 때문이다...

 

 

 

 

신버전에서 체크박스 인식 여부 확인

반응형