1. 정의
- SNS의 대량의 리뷰로부터 사용자가 원하는 정보를 신속히 분석, 유의미한 정보를 지능적으로 유추해내는 Mining 기술
2. 오피니언 마이닝 프로세스 및 구성요소
가. 프로세스
- 데이터 수집 ->
- 도메인 지식 추출{ 전처리, 도메인 의존적 단어, 문장 정보, 단서 단어} ->
- 오피니언 추출{개체명 인식 -> 관계 추출} ->
- 평가(시스템 평점)
나. 구성요소
- 도메인 지식 추출
- 전처리 : 객관적인 문장인지 주관적인 문장 인지 분리, 사실을 기술한 객관적 문장은 분석대상에서 제외, 문장분리 및 형태소 분석
- 도메인 의존적 단어 : 특정단어가 주어진 도메인에서 발생한 빈도와 일반 도메인의 신문기사에서 발생한 빈도 비교
- 연어정보(문장 정보) : likelihood ratio(우도; 발생가능 비율)를 평가 척도로 활용
- 단서 단어 : 개체명 인식에서 단서 단어를 찾는데 활용
- 오피니언 추출
- 개체명 인식 : 평가요소 또는 오피니언에 해당하는 단어 열을 인식
- 관계 추출 : 평가요소-오피니언 관계 중 관련성이 존재하는 연결관계만을 인식
'정보관리기술사 > IT경영전략' 카테고리의 다른 글
신경망 분석 (0) | 2023.12.15 |
---|---|
텍스트 마이닝 (0) | 2023.12.15 |
프로세스 마이닝 (0) | 2023.12.15 |
Data Minining (0) | 2023.12.15 |
SCM(Supply Chain Management (0) | 2023.12.15 |