반응형
최근 IT에서 가장 주목받고 있는 항목이라고 한다면 단연 음성인식 기술이다. 이는 차세대 스마트폰을 이끌어갈 기술이며, 인간의 긍극적인 의사소통의 수단인 음성을 기계와 소통시키는 엄청난 기술이다. 아주 오래전부터 먼 미래에는 기계들이 인간의 말을 알아들을 수 있는 시대가 열릴 것이라고 예측했고 그것을 꿈꿔왔다. 그러나 사람들이 저마다 지문들이 다른 것처럼 인간들의 목소리와 억양은 저마다 다르기 때문에 굉장한 기술력이 뒷받침이 되지 않으면 안된다.
혹자들은 스마트폰에 과연 음성인식 기술이 필요하냐? 라는 질문을 던지기도 한다. 그러나 음성인식이라는 기술은 단순히 통화의 목적을 위한 것이 아니다. 초기 핸드폰이 자판으로 명령을 내렸다가 일부 터치로 명령을 내리고, 애플에 의해 시작된 풀터치 스크린 방식은 이제 핸드폰의 표준 입력 시스템이 되어버렸다.
스티브잡스가 있던 시절 시리 연구가 한창 진행되었고 어쩌면 스티브잡스가 풀터치 스크린 다음으로 혁신적인 기술로 시리를 준비하고 있었는지 모른다. 여하튼, 음성인식 기술은 메시지를 굳이 자판을 두드리거나 터치하지 않아도 원하는 언어를 텍스트화 하기 때문에 실로 스마트폰을 중심으로 발전될 수 밖에 없다. 왜냐하면 단문의 텍스트 문장을 가장 많이 만들어 내는 기계는 바로 스마트폰이기 때문이다.
애플부터 시작된 음성인식 기술은 이제 모바일 시장에서 새로운 경쟁력으로 부상되며, 애플 이외의 회사에서도 뒤 이어 애플의 시리를 잡지 위한 음성인식 기술을 연구하고 있다. 그 예로 아드로이드의 구글사는 곧 구글폰의 음성인식 시스템인 '마젤'을 내놓는다고 발표했다. MS사 역시 이에 뒤질세라 윈도우 폰에서 음성인식 비서라고 이름 붙인 ‘애스크 지기(Ask Ziggy)"를 내놓았다. 이제 모바일 시장에서 음성인식의 대결은 삼파장으로 이어졌다.
그러나 모바일 뿐만 아니라 이제 게임시장에서도 음성인식 기술은 새로운 분야이다. 예전에는 게임기라면 조이스틱이나 키보드, 마우스로 하는 것이라고 생각했다. 그러나 닌텐도 위나 플레이스테이션은 바형태의 리모컨을 움직여 게임을 하며, XBOX는 사람의 움직임을 인식하는 모션인식방식으로 게임을 할 수 있다. 그러나 이제 모션과 더불어 음성인식이 곧 게임기에도 적용될 듯 싶다.
이러한 음성인식기술은 다양한 방면에서 활용가능한데, 가장 주목받을 수 있는 분야는 바로 장애인분야이다. 즉, 시각장애인들 같은 경우는 쿼터 자판이나 키패드형식에서는 문자를 보낼 수 있다. 그러나 이제 풀터치 스크린이 표준이 된 시점에서 장애인들의 핸드폰 활용도는 떨어진다. 그러나 음성인식 기술이 보강되면, 장애인들도 문자를 음성으로 보내고, 문자를 음성으로 들을 수 있는 시대가 올 것이다.
두번째는 자동차에 적용되었을 시 운전자의 편의를 제공할 수 있다는 것이다. 사고의 위험 때문에 운전중 통화를 하거나 문자를 주고받는 것은 금지되어 있다. 그러나 급박하게 돌아가는 사회속에서 운전중 통화가 제약되는 것은 많은 어려움을 줄 수 있다. 그러나 음성인식 기술이 발달되면 운전자들에게 안전한 편리성을 제공할 수 있을 것이다. 또한 네비게이션등 운전중 조작이 필요한 경우 매우 유용할 것이다(물론 음성으로 검색하는 네비게이션이 있지만, 아직 안정화된 수준의 기술이 아니다).
음성인식 기술은 앞으로 모바일 시장을 비롯해 다양한 분야에서 활용도가 매우 높다. 따라서 반드시 연구되고 개발되어야 하는 분야이다. 모바일 시장에서 가장 먼저 이 분야를 개척하고 개발해 냈기 때문에 일단 모바일에서 그 기술이 검증되겠지만, 음성인식은 미래를 여는 진보적인 기술이며, 인간생활에 혁신적인 편의를 제공할 것이다.
혹자들은 스마트폰에 과연 음성인식 기술이 필요하냐? 라는 질문을 던지기도 한다. 그러나 음성인식이라는 기술은 단순히 통화의 목적을 위한 것이 아니다. 초기 핸드폰이 자판으로 명령을 내렸다가 일부 터치로 명령을 내리고, 애플에 의해 시작된 풀터치 스크린 방식은 이제 핸드폰의 표준 입력 시스템이 되어버렸다.
스티브잡스가 있던 시절 시리 연구가 한창 진행되었고 어쩌면 스티브잡스가 풀터치 스크린 다음으로 혁신적인 기술로 시리를 준비하고 있었는지 모른다. 여하튼, 음성인식 기술은 메시지를 굳이 자판을 두드리거나 터치하지 않아도 원하는 언어를 텍스트화 하기 때문에 실로 스마트폰을 중심으로 발전될 수 밖에 없다. 왜냐하면 단문의 텍스트 문장을 가장 많이 만들어 내는 기계는 바로 스마트폰이기 때문이다.
애플부터 시작된 음성인식 기술은 이제 모바일 시장에서 새로운 경쟁력으로 부상되며, 애플 이외의 회사에서도 뒤 이어 애플의 시리를 잡지 위한 음성인식 기술을 연구하고 있다. 그 예로 아드로이드의 구글사는 곧 구글폰의 음성인식 시스템인 '마젤'을 내놓는다고 발표했다. MS사 역시 이에 뒤질세라 윈도우 폰에서 음성인식 비서라고 이름 붙인 ‘애스크 지기(Ask Ziggy)"를 내놓았다. 이제 모바일 시장에서 음성인식의 대결은 삼파장으로 이어졌다.
그러나 모바일 뿐만 아니라 이제 게임시장에서도 음성인식 기술은 새로운 분야이다. 예전에는 게임기라면 조이스틱이나 키보드, 마우스로 하는 것이라고 생각했다. 그러나 닌텐도 위나 플레이스테이션은 바형태의 리모컨을 움직여 게임을 하며, XBOX는 사람의 움직임을 인식하는 모션인식방식으로 게임을 할 수 있다. 그러나 이제 모션과 더불어 음성인식이 곧 게임기에도 적용될 듯 싶다.
이러한 음성인식기술은 다양한 방면에서 활용가능한데, 가장 주목받을 수 있는 분야는 바로 장애인분야이다. 즉, 시각장애인들 같은 경우는 쿼터 자판이나 키패드형식에서는 문자를 보낼 수 있다. 그러나 이제 풀터치 스크린이 표준이 된 시점에서 장애인들의 핸드폰 활용도는 떨어진다. 그러나 음성인식 기술이 보강되면, 장애인들도 문자를 음성으로 보내고, 문자를 음성으로 들을 수 있는 시대가 올 것이다.
두번째는 자동차에 적용되었을 시 운전자의 편의를 제공할 수 있다는 것이다. 사고의 위험 때문에 운전중 통화를 하거나 문자를 주고받는 것은 금지되어 있다. 그러나 급박하게 돌아가는 사회속에서 운전중 통화가 제약되는 것은 많은 어려움을 줄 수 있다. 그러나 음성인식 기술이 발달되면 운전자들에게 안전한 편리성을 제공할 수 있을 것이다. 또한 네비게이션등 운전중 조작이 필요한 경우 매우 유용할 것이다(물론 음성으로 검색하는 네비게이션이 있지만, 아직 안정화된 수준의 기술이 아니다).
음성인식 기술은 앞으로 모바일 시장을 비롯해 다양한 분야에서 활용도가 매우 높다. 따라서 반드시 연구되고 개발되어야 하는 분야이다. 모바일 시장에서 가장 먼저 이 분야를 개척하고 개발해 냈기 때문에 일단 모바일에서 그 기술이 검증되겠지만, 음성인식은 미래를 여는 진보적인 기술이며, 인간생활에 혁신적인 편의를 제공할 것이다.