음성인식 기반 기술의 발전 과정
언어와 음성에 대한 연구는 앞서 언급한 바와 같이 1950년대로 거슬러 올라갈 수 있습니다. 초기에는 개별 숫자, 음절, 모음을 인식하는 시스템을 만들기 위한 노력이 이루어졌으며, 1963년 IBM이 총 16개의 단어를 인식할 수 있는 “Shoebox”라는 기기를 소개 하였고, 1971년부터 시작된 미국 국방부 산하 국방첨단연구사업국(DARPA)의 음성이해연구 프로그램 (Speech Understanding Research)을 통해 비약적으로 발전하는 계기를 얻었습니다(한국콘텐츠진흥원, 2011. 11). 고립단어(Isolated word)를 인식하는데 한정되었던 음성인식기술은 1980년대에 들어서야 연결단어(Connected word)를 처리할 수 있게 되었으며 인식할 수 있는 단어도 10,000개 수준으로 크게 늘어나게 됩니다.(Furui, 2005). 또한 미국의 카네기멜론대학(CMU)이 불특정화자의 목소리를 인식할 수 있는 음성인식 소프트웨어 “SPHINX”를 소개하고, 은닉 마르코프 모델(Hidden Markov Model) 로 대표되는 통계적 프레임워크가 이용되기 시작했으나 컴퓨터의 처리 속도 및 저장 공간 문제로 음성인식 기술의 사용화는 요원했으나, 최근에는 이러한 문제들이 클라우드 컴퓨팅 기반하에 ICT 사용 환경이 크게 변화하면서, 실시간으로 유사 음성을 검색하고 대용량의 음성 데이터를 빠른 속도로 분석할 수 있게 되었습니다.
#음성인식, #텍스트 인식, #UI/UX, #음성합성, #딥러닝 , #AI 플랫폼 , #AI Speaker
상세한 내용은 첨부파일을 확인하세요~!