ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 프로젝트 주제 변경 (화상회의 플랫폼 개발)
    졸업프로젝트 2021. 1. 11. 12:28

     

    맥락을 파악하는 AI?

     

    우리 프로젝트 주제인 AI 성우가 읽어주는 참여형 영어 동화 어플리케이션의 가장 큰 특징은

    동화의 텍스트가 주어지면 인물들의 성별과 나잇대 같은 특성을 파악하여 적합한 목소리로 동화를 읽어준다는 점이다.

     

    이것을 구현하기 위해선, 

    1. 등장인물 파악

    2. 특성을 나타내는 단어 파악 (boy, girl, mother, father... )

    3. 등장인물 별 대사 구분

    이 필수적으로 개발되어야 했다.

     

    1,2번이 구현되었다는 가정 하에 3번은 어렵지 않게 구현할 수 있을 것 같았다.

    일반적으로, 발화 동사 앞 주어를 발화자로 설정하고 특성에 맞는 TTS 목소리를 출력하는 방식으로.. 

    여러 가지 상황에 맞도록 예외처리를 해줘야 하지만.. 

     

    하지만, 1,2번 구현이 불가능처럼 느껴졌다.

    동화 텍스트 속에서 등장인물이라고 특정 지을 수 있는 상황이 매우 복잡하고 다양했다. 

    헨젤, 그레텔과 같이 이름으로 주어지는 경우도 있지만, father, mother처럼 등장할 수도 있기 때문이다.

     

    또한 사람이라면 mother, father을 보고 중년의 여성과 남성이라고 생각할 수 있지만, 

    컴퓨터로 단어를 보고 나이대와 성별을 구분하는 것이 어렵다고 생각되었다.

     

    그나마 해결책으로 찾은 것이 특성을 나타내는 단어 Dataset을 넣고 구분한다는 것이었는데..

    이것은 딥러닝을 이용한 것이 아닌 Ctrl+f 방식이라고 생각했다.

     

    이는 우리 프로젝트 방향성과 거리가 멀었고,

    결국 주제를 변경하게 되었다.

     

     

     

    새로운 주제 (화상회의 플랫폼)

     

     

    개발 동기

     

    코로나로 인한 비대면 수업과 재택근무로 인해 화상 회의의 수요가 높아지게 되었다.

    화상 회의는 음성 또는 비디오의 형태로 기록되기 때문에 휘발성이라는 특징을 가진다.

    또한, 주기적으로 진행되는 회의의 지난 기록을 관리해주는 플랫폼이 없다.

    이러한 불편한 점에 기인하여 새로운 플랫폼을 개발하기로 하였다.

     

     

    프로젝트 한 줄 요약

     

    회의록 자동 작성과 분석을 제공하는 그룹형 화상 회의 플랫폼

     

    특징

     

    1. 회의 담화 실시간 채팅 제공

    : 화상 회의 특성상 오디오가 끊기거나 발언이 겹치는 등의 이유로 지체되는 회의를 방지할 수 있다.

    2. 모두를 위한 접근성 보장

    : 실시간 채팅 제공을 통해 청각 장애인의 화상 회의 참여가 가능하고, 올라온 채팅을 음성으로 읽어줌으로써 시각 장애인의 참여를 가능하게 한다.

    3. 회의 스크립트 제공

    : 실시간 채팅 내용을 기록함으로써 오디오, 비디오 형태가 아닌 문자 형식의 스크립트를 제공하여 회의록을 관리한다.

    4. 회의 스크립트 분석

    : 제공된 스크립트를 분석하여 주요 토픽과 키워드를 제공하여 이전 회의 내용을 검색하기 쉽도록 한다.

     

    타 플랫폼과 비교(간단하게..)

     

    zoom: 이전 회의를 비디오, 오디오 형태로만 기록

    google meet: 청각 장애인을 위한 자막을 제공하지만, 기록하진 않는다.

    다글로: 실시간 스크립트가 아니고, 음성 녹음 파일을 넣어 텍스트로 변환하는 형식. 분석은 제공하지 않음

     

     

    댓글

Designed by Tistory.