자연어 / 계량서지 분석

선행 연구 수집부터 토픽 분석 + 네트워크 시각화까지.

PDF 업로드 또는 OpenAlex 검색으로 문헌을 수집하고, 토픽·키워드 네트워크·시점별 토픽 변화를 한 번에 확인합니다. 대용량 PDF 처리·로컬 모델 다운로드가 필요해 온프레미스 데스크톱 앱 전용으로 제공됩니다.

한눈에 보기

주요 활용

선행 연구 동향 · 키워드 군집 · 학술 보고서

수집 경로

OpenAlex 검색 / Excel 메타데이터 / PDF 일괄 업로드

지원 언어

한국어 · 영어 (stanza 기반 토큰화)

엔진

gensim LDA · networkx + pyvis

출력

워드클라우드 · 토픽 표 · 네트워크 그래프 · 전략 다이어그램

제공 방식

온프레미스 데스크톱 앱 전용

데이터 준비

  1. 1OpenAlex 검색: 키워드 + 연도 범위 입력 → 메타데이터 자동 수집
  2. 2또는 Excel 업로드: title / abstract / year 컬럼 필수
  3. 3또는 PDF 폴더 업로드 (그룹별로 폴더 분리 시 자동 인식)
  4. 4전처리: 불용어 + 사용자 정의 stopword 제거
  5. 5토큰화 결과 확인 후 토픽 모델링 진행

PDF 를 그룹별 폴더로 묶어 업로드하면 자동으로 그룹명이 라벨링되어 그룹간 토픽 비교가 가능합니다.

분석 흐름

  1. 1데이터 수집 (OpenAlex / Excel / PDF)
  2. 2토큰화 + 불용어 처리 (stanza)
  3. 3워드클라우드 + 빈도 분석
  4. 4LDA 토픽 최적 K 자동 탐색 (coherence)
  5. 5토픽 모델링 + 토픽별 키워드 + 분포
  6. 6네트워크 분석 (키워드 공출현)
  7. 7시계열 토픽 변화 + 전략 다이어그램

지원 분석

  • 워드클라우드 + 빈도 분석

    전체 / 그룹별 주요 키워드를 시각화 + Top-N 표

  • LDA 토픽 모델링

    Coherence 기반 최적 K 자동 탐색 후 토픽 + 키워드 도출

  • 네트워크 분석

    키워드 공출현 그래프 + 중심성 + 군집 시각화

  • 시계열 토픽 분석

    연도별 토픽 비중 변화 + Mann-Kendall 추세 검정

  • 전략 다이어그램

    Density × Centrality 사분면으로 연구 분야 포지셔닝

활용 예시

  • 선행 연구 동향 파악

    관심 주제 키워드로 OpenAlex 검색 → 최근 10년 토픽 변화를 자동 분석.

  • 내부 보고서 토픽 정리

    PDF 보고서를 부서별 폴더로 업로드 → 부서별 핵심 토픽 비교.

  • 학술 리뷰 논문 초안

    수집 → 분석 → 시각화 결과를 그대로 LaTeX 논문 형식으로 출력.

결과물

  • 수집 메타데이터 표 + 연도 분포
  • 워드클라우드 + Top-N 키워드 표
  • 토픽별 키워드 + 문서 분포 + 시계열 변화
  • 네트워크 그래프 + 전략 다이어그램
  • 논문 형식 자동 생성 (LaTeX → PDF)