16.2 감성 분석
IMDB 데이터를 통한 감성분석 데이터셋 로드 (X_train, y_train), (X_test, y_test) = keras.datasets.imdb.load_data() X_train[0][:10] #[1, 14, 22, 16, 43, 530, 973, 1622, 1385, 65] * IMDB의 training set은 문장의 구두점을 제거하고 소문자로 변환하여 빈도에 따라 인덱스가 부여되어있다. * 인덱스가 낮을 수록 자주 등장하는 단어이다. * 또한 0은 , 1은 , 2는 즉, 알 수 없는 단어를 의미한다. 만약 데이터셋을 문장으로 디코딩하고 싶다면 아래와 같이 디코딩해야 한다. #인덱스를 단어로 디코딩하는 법 word_index=keras.datasets.imdb.get_word_index() ..
2021. 11. 23.