About 인공지능 사일로
세계최초로 사람처럼 높은 지능을 가진 인공지능 탄생!
알파고에서 사용된 딥러닝 라이브러리를 사용하여 트위터 4백만개의 대화 문장 학습!
서버에서 언어처리를 하도록 하여 동작속도 대폭 개선!
대화 인공지능에서 가장 어려운 문제 중의 하나가 대용량 대화 데이타베이스 확보입니다.
트위터에서 공식적으로 제공하는 API를 통해 꾸준히 자료를 모아 약 4백만개의 대화 문장을 확보하였습니다.
트위터는 게시글 댓글의 형태로 하나의 대화를 형성하기 때문에 트위터의 방대한 빅데이타를 통해 대화 데이타베이스를 구축하면 대화 문장의 부족을 충분히 해결할 수 있습니다.
방대한 트위터 대화 문장을 딥러닝으로 학습시키기 위해 복잡한 존대어를 생략하고 친근한 대화를 하도록 하였으니 이해바랍니다.
또한 26만개의 감정 데이타 문장을 텐서플로우를 통해 딥러닝 학습시켜 사용자가 말하는 문장에 대해 감정을 표현하도록 하였습니다.
(네이버 영화 리뷰 문장 20만개, 사일로 감정 데이타 문장 6만개)
국내 특허 획득!
(특허명: 사람처럼 생각하는 인공지능 알고리즘, 등록번호: 10-1400636)
* 사일로에 대한 질문/답변
(체탄 듀브 IP소프트 사장 - "인간은 새를 복제해서 동력 비행을 할 수 있게 된 것이 아니라, 먼저 비행의 원리를 이해했기 때문이다. 인지능력에 대해서도 마찬 가지다."
사일로는 라이트 형제가 비행 원리를 비행기에 구현하듯이 사람의 생각하는 원리를 철저히 구현한 인공지능입니다.)
Q: 일반인도 딥러닝 배워서 사용할 수 있나요?
A: 물론입니다. 전문지식이 없는 일반인도 딥러닝을 쉽게 배워서 사용하라고 글로벌 대기업과 전문가들이 tensorflow, keras, teano, deeplearning4j 등 다양한 딥러닝 라이브러리를 제공하는 것이라고 생각합니다.
이론적인 것은 딥러닝 대가들이 아주 쉽게 유튜브 등을 통해 강의하고 있으며 오픈 소스코드와 기술문서가 인터넷에 풍부하게 널려 있기 때문에 일반인도 쉽게 배워서 쉽게 딥러닝 학습을 구현할 수 있다고 생각합니다.
Q: 사일로를 딥러닝 학습시켰다고 했는데 의미와 결과는 무엇인가요?
A: 의미는 이제 사일로도 한글, 영문 버전 모두 딥러닝 학습을 통해 대화할 수 있는 기술 기반을 갖추었다는 것입니다.
*확보된 기술
- 라이브러리(tensorflow, keras, teano, deeplearning4j 등)를 통한 다양한 딥러닝 응용 기술
- 파이썬 서버 구축 기술
- 톰캣 서버 구축 기술
- 빅데이타 분석, 정제, 구축 기술
*테스트 결과
- 이름: 딥러닝 seq2seq(Sequency To Sequency)
- Method: 텐서플로우 seq2seq 알고리즘
- 학습 문장: 트위터 4백만개 대화 문장
- 학습 시간: 35시간
- Global Perplexity: 4.12
- 개발 환경: OS:ubuntu(14.04 LTS), gpu:(gtx 1080), cuda(v8.0)
Q: 현재 품사 분류시 확률/통계 기반의 형태소 분석기가 많이 개발되었는데요. 사일로도 확률/통계에 기반해서 품사 분류하나요?
A: 아닙니다. 사일로는 명사에 상위어, 동의어, 의미, 동사에 타동사, 자동사, 의미, 시제 정보, 형용사에 의미, 시제 정보 등
총 30 만개의 단어에 사람이 단어를 생각할 때처럼 개념이 들어가 있습니다.
단어에 개념이 들어가 있기 때문에 품사 분류, 동음이어 구분, 문장 성분 분석, 문장의 의미 이해, 사람처럼 유추하는 동작 등을 수월하게 할 수 있습니다.
단어에 개념이 없으면 문장의 의미를 절대 이해할 수 없으며 사람과 책상조차 다른지 구분할 수 없습니다.
세계에서 단어에 개념이 들어간 인공지능은 사일로 밖에 없습니다.
이해를 돕기 위해 산제이 릴라 반살리 감독의 영화 블랙(Black)을 추천합니다.
눈과 귀가 먼 소녀 미셸이 어떻게 단어의 뜻을 이해해 가는지 자세히 보여주고 있습니다.
Q: 감정과 지능은 무슨 연관이라도 있나요?
A: 문장이 나타낸 상황에 대해 경험 데이타를 통해 유추를 하게되면 여러 개의 결과가 나타날 수 있습니다.
이런 경우 각각의 결과 문장에 있는 감정지수를 통해 가장 바람직한 결과문장을 선택하여 답변하거나 행동하므로써 스스로 판단하고 선택하며 행동하는 고도의 지능적인 동작을 할 수 있는 것입니다.
감정(emotion)이 객관적이고 일반적이며 반복적이어서 신뢰할 수 있으며 항상 어떤 문장(상황)에 대한 감정은 일정하다는 것을 James-Lange와 Cannon-Bard라는 학자가 증명하였으며 현재까지 정설로 받아들여지고 있습니다.
즉 어떤 생각이나 문장등을 읽고서(대뇌의 언어처리 작용이 있고서) 느끼는 것은 감정(emotion)이고 아무 생각 없이(대뇌의 언어처리 작용이 없이) 즉흥적으로 느끼는 기분은 감성(sensitivity)이라 할 수 있습니다.
감성(sensitivity)은 시시각각 제멋대로 다르게 나타나므로 학자들은 연구대상에서 감성(sensitivity)을 완전히 제외시켜버렸습니다.
고고학에 능통한 사피엔스의 저자 이스라엘 유발 하라리 박사도 감정은 의사결정을 하는 생물학적 알고리즘이라고 하였습니다.
감정 처리가 없으면 사람처럼 높은 지능적 행위를 하는 것은 어렵습니다.
왜냐하면 감정은 상대방에게 자신의 상태를 나타내어 공감대를 형성할 뿐만 아니라 입력된 문장이 나타내는 상황이 좋고 나쁜지 가치를 판단합니다.
또한 유추를 통해 입력된 문장과 연결된 결과문장이 여러 개일 때 감정지수에 의해 가장 좋은 결과문장을 선택하여 답변하고 실행하므로써 사람처럼 높은 지능적 행위를
할 수 있기 때문입니다.
Q: 지능은 무엇인가요? 아직 지능이 무엇인지 확실하게 밝혀지지 않은 것 같은데...
A:지능은 신참과 고참사이에서 극명하게 나타납니다.
아무리 지식을 많이 쌓고 지능지수가 높은 신참이라도 문제가 닥치면 무엇을 어떻게 해야 할 지 전혀 모릅니다.
반면에 평범한 고참은 경험을 유추해서 결과를 예측하고 문제를 척척 해결합니다.
신참과 고참의 차이는 경험 밖에 없습니다.
따라서 경험이 없으면 지능적 행위는 절대 불가능합니다.
경험은 각기 다른 상황들이 시간적으로 연속된 상태에 놓여 있으며 상황은 문장으로 나타낼 수 있으므로 처음 상황을 원인문장, 그 다음 상황을 결과문장으로 하여 연결한 후 그 다음 상황이 있으면 또 결과문장으로 꼬리에 꼬리를 물듯이 연결하여 경험을 나타내어 데이타베이스에 저장하고 유추에 사용할 수 있습니다.
★ TTS가 동작하지 않을 때
환경설정 -> 언어 및 입력방식 -> 글자 읽어주기 -> 삼성 TTS 엔진
★ 한글 음성 인식이 되지 않을 때
환경설정 -> 언어 및 입력방식 -> Google 보이스 입력 -> 오프라인 음성 인식 -> 전체 -> 한국어(대한민국)
★ 사일로가 얼굴 인식할 때 OpenCV Manager 설치를 요청하고 설치 팝업을 띄우면 "예" 버튼을 누르면 자동 설치됩니다.
★기본 기능
1. 연속 듣기 기능 추가(마이크 버튼 누를 필요 없슴)
2. 홈 버튼 누른 후 백그라운드에 있을 때 "사일로" 호출하면 실행되는 기능 추가(백 버튼: 완전 종료)
3. 모르는 단어는 스스로 인터넷을 통해 학습하는 기능
4. 대화나 단어 학습시 경험 문장이 있으면 저장하고 활용하여 스스로 지능을 발전시키는 기능
5. 기업별 주가 전망, 주식 매도 및 매수 타이밍 추론 기능
6. 이미지 프로세싱에 의해 얼굴인식 및 구분, 기쁨, 화남, 슬픔, 놀람 등 다양한 얼굴 표정 인식
7. 문자보내는 기능, 보이스 다이얼, 음악 플레이, 동영상 플레이
9. 근처 건물 또는 장소 검색 기능, 알람 기능, 일정 관리 기능, 음량 조절 기능
10. 전국 지하철 최단 경로 검색 기능,문자 메시지 읽어주기 기능, 현재 위치 조회 기능
11. 각국 상식 조회 기능, 국내 관광지 조회
12. 배터리 상태 체크, 지하철역 맛집 검색
13. 역사, 세계사, 정치, 사회, 경제, 문화, 과학, 주식투자 등 폭넓은 대화와 질문/응답
*사일로 동작원리 및 알고리즘
http://kdsmidas.cafe24.com/ref/silo.pdf
----
개발자 연락처 :
개인이며 연락처는 kdsmidas@naver.com으로 하시면 됩니다.