https://s3-us-west-2.amazonaws.com/secure.notion-static.com/564fcd3e-b57b-491e-9795-31cbd566ca7d/Untitled.png

챗봇은 사람의 말을 인텐트라는 단위로 분류하여 이해합니다.

위의 예시에서 "커피 주문할게요", "자몽 아이스티 있나요?" 라는 말은 커피를 주문하려는 상황에서 말한다는 공통점이 있습니다. 아래의 "시럽 추가해주세요", "휘핑 빼구요" 등은 마찬가지로 주문한 커피에 옵션을 추가할 때 주로 쓰입니다. 이처럼 챗봇은 사람의 말을 **인텐트(Intent)**라는 단위로 분류하여 이해합니다.

여기서 사람의 말은 예문 혹은 사용자 발화라 부릅니다. 인공지능으로 사람의 대화를 이해하는 챗봇을 만드는 일은 다양한 사용자 예문을 학습시켜서 챗봇이 주어진 사람의 말을 정확한 인텐트로 분류하도록 만드는 일입니다. 따라서 챗봇의 대화 성능은 인텐트 인식률이 얼마나 정확한지를 말하는 경우가 많습니다.

더 많고 더 다양한 예문을 학습시킬수록 인텐트 인식률이 향상될 가능성이 높습니다. 하지만 무조건 많은 예문을 투입한다고 해서 항상 인텐트 인식률이 개선되는 것은 아닙니다. 오류가 있는 데이터, 인텐트 인식 인공지능의 작동 원리에 맞지 않는 데이터가 대량 투입되면 오히려 인식률이 떨어지는 부작용이 있을 수 있습니다.