TensorflowASR Conformer Model Tester [use. Streamlit]

2021. 8. 2. 01:11프로젝트

반응형

[ TensorflowASR Conformer Model Tester ]

 

해당 프로젝트는 아래 링크의 프로젝트를 활용 하였습니다.

https://github.com/TensorSpeech/TensorFlowASR

 

GitHub - TensorSpeech/TensorFlowASR: TensorFlowASR: Almost State-of-the-art Automatic Speech Recognition in Tensorflow 2. Suppor

:zap: TensorFlowASR: Almost State-of-the-art Automatic Speech Recognition in Tensorflow 2. Supported languages that can use characters or subwords - GitHub - TensorSpeech/TensorFlowASR: TensorFlowA...

github.com


 

STT 모델 개발 전, 기존에 나와있는 모델을 알아보는 도중 TensorflowASR 프로젝트를 찾아,

해당 프로젝트의 모델들을 테스트 해보았습니다.

 

해당 프로젝트에는

- contextnet

- conformer

- rnn_transducer

등 모델들이 있었습니다.

 

위에 적혀진, 세가지의 모델들의 성능지표를 살펴보고 가장 괜찮은 모델로 conformer 모델을 선택하였습니다.

해당 모델을 가지고 audio파일을 넣어 계속 테스트를 해볼 것 이라, 베타를 만들어야 했습니다.

 

해당 프로젝트 코드는 모델들의 성능지표를 보기 위한 코드라 로직을 변경해줘야 했습니다.

목표는

Input : Audio File [flac, wav, mp3] 이면,

Output : Text

입니다.


[ 결과 ]

Beta는 Web으로 개발하였습니다.

- Input 데이터를, 테스트할 파일 데이터가 들어있는 tsv 파일에서,

  Audio File 하나만 넣을 수 있도록 코드를 변경 하였습니다.

- 기존 Output File을, 여러 데이터가 포함되어있는 tsv 파일이 생성되는 방법에서,

  Text 데이터가 반환되도록 로직을 변경 하였습니다.

- 필요없는 코드를 제거하고 코드를 간소화 하였습니다.

- Beta는 Streamlit을 이용하였습니다. (Streamlit - Python Web Application)


[ 후기 ]

코드 분석을 마치고 코드를 수정하는데 디버깅이 안되서 1주라는 시간을 엄청 잡아 먹었습니다;;

알고보니 Local Library을 사용하는줄 알고 계속 코드를 수정하고 있었는데,

사실은 Python Package안에 Library를 사용하고 있는거여서 아무리 Local Library 코드를 수정해도 소용이 없었던거였습니다.

(해당 사실을 알고나서 2시간만에 로직을 다수정하고 모듈을 완성했다는;;)

 

이상 포스팅을 마치도록 하겠습니다.


https://github.com/Mr-DooSun/TensorflowASR_Conformer_Tester

 

GitHub - Mr-DooSun/TensorflowASR_Conformer_Tester

Contribute to Mr-DooSun/TensorflowASR_Conformer_Tester development by creating an account on GitHub.

github.com

 

반응형