기타 프로젝트

연구분야

기타 프로젝트

자기소개서 한 줄 요약

  • 연구 개요
    • Seq2Seq모델을 사용하여 자기소개서를 한 줄로 요약
  • 연구내용 및 성과
    • 합격자소서(2014년도 이후~)를 대상으로 데이터 세트 구축
      • 소제목&본문을 하나의 pair로 하는 총 744,712건의 데이터 수집
    • 임베딩 방식을 개선하여 딥러닝 모델의 성능을 향상시킴
      • fastText로 단어 임베딩 시, 품사 정보도 포함시켜 한국어 문장구조 학습이 용이하도록 함
        (품사 단위의 단어 임베딩을 수행, 품사정보를 얻기 위해 형태소 분석기인 KoNLPy(twitter)를 사용)
      단어 임베딩 예시 단어 임베딩 예시
    • 자기소개서 내에 포함되어 있지 않던 새로운 문장으로 내용 한 줄 요약
      seq2seq모델의 자기소개서 요약 결과 예시 seq2seq모델의 자기소개서 요약 결과 예시
  • 응용분야
    아래의 내용을 참고바랍니다. 아래의 내용을 참고바랍니다.
    • 응용분야 1 : 자연어처리 기반 챗봇(Chatbot)
    • 응용분야 2 : 정서 분석(Sentimental Analysis)을 통한 소비자 분석
    • 응용분야 3 : 정보 검색

감정분석을 통한 주가 상하락 예측서비스

  • 연구 개요
    • CNN을 적용한 자연어 처리를 통해 주가 상승 하락과의 연관성 분석 및 어플리케이션 개발
  • 연구내용 및 성과
    • 자연어 처리 기술
      • 기존의 감성사전 기반의 자연어 처리에서 나아가 이미지 분류 알고리즘을 자연어에 적용, 정확도 70% 확보
      아래의 내용을 참고바랍니다. 아래의 내용을 참고바랍니다.
      • Data : 기업별 기사 크롤링 → 주가 관련 라벨링 → 데이터 구축
      • Model : Client, 고유명사 추출 및 vectorize 이후 모델 학습
      • Aapplication : 상승 하락 확률 및 모델 추론 결과 시각화
    • 어플리케이션 개발
      • 주가 예측 및 LIME을 적용해 모델의 분석 결과를 나타내주는 어플리케이션 개발
      • 딥러닝으로 일주일 뒤의 주가 상·하락을 예측하는 기존의 서비스에서 하루 뒤의 상·하락을 예측 가능하도록 보완
      어플리케이션 화면 어플리케이션 화면
  • 응용분야
    • 비정형 데이터를 활용한 주가 예측 및 기업 평가
TOP