자연어 / 계량서지 분석
선행 연구 수집부터 토픽 분석 + 네트워크 시각화까지.
PDF 업로드 또는 OpenAlex 검색으로 문헌을 수집하고, 토픽·키워드 네트워크·시점별 토픽 변화를 한 번에 확인합니다. 대용량 PDF 처리·로컬 모델 다운로드가 필요해 온프레미스 데스크톱 앱 전용으로 제공됩니다.
한눈에 보기
주요 활용
선행 연구 동향 · 키워드 군집 · 학술 보고서
수집 경로
OpenAlex 검색 / Excel 메타데이터 / PDF 일괄 업로드
지원 언어
한국어 · 영어 (stanza 기반 토큰화)
엔진
gensim LDA · networkx + pyvis
출력
워드클라우드 · 토픽 표 · 네트워크 그래프 · 전략 다이어그램
제공 방식
온프레미스 데스크톱 앱 전용
데이터 준비
- 1OpenAlex 검색: 키워드 + 연도 범위 입력 → 메타데이터 자동 수집
- 2또는 Excel 업로드: title / abstract / year 컬럼 필수
- 3또는 PDF 폴더 업로드 (그룹별로 폴더 분리 시 자동 인식)
- 4전처리: 불용어 + 사용자 정의 stopword 제거
- 5토큰화 결과 확인 후 토픽 모델링 진행
PDF 를 그룹별 폴더로 묶어 업로드하면 자동으로 그룹명이 라벨링되어 그룹간 토픽 비교가 가능합니다.
분석 흐름
- 1데이터 수집 (OpenAlex / Excel / PDF)
- 2토큰화 + 불용어 처리 (stanza)
- 3워드클라우드 + 빈도 분석
- 4LDA 토픽 최적 K 자동 탐색 (coherence)
- 5토픽 모델링 + 토픽별 키워드 + 분포
- 6네트워크 분석 (키워드 공출현)
- 7시계열 토픽 변화 + 전략 다이어그램
지원 분석
워드클라우드 + 빈도 분석
전체 / 그룹별 주요 키워드를 시각화 + Top-N 표
LDA 토픽 모델링
Coherence 기반 최적 K 자동 탐색 후 토픽 + 키워드 도출
네트워크 분석
키워드 공출현 그래프 + 중심성 + 군집 시각화
시계열 토픽 분석
연도별 토픽 비중 변화 + Mann-Kendall 추세 검정
전략 다이어그램
Density × Centrality 사분면으로 연구 분야 포지셔닝
활용 예시
선행 연구 동향 파악
관심 주제 키워드로 OpenAlex 검색 → 최근 10년 토픽 변화를 자동 분석.
내부 보고서 토픽 정리
PDF 보고서를 부서별 폴더로 업로드 → 부서별 핵심 토픽 비교.
학술 리뷰 논문 초안
수집 → 분석 → 시각화 결과를 그대로 LaTeX 논문 형식으로 출력.
결과물
- 수집 메타데이터 표 + 연도 분포
- 워드클라우드 + Top-N 키워드 표
- 토픽별 키워드 + 문서 분포 + 시계열 변화
- 네트워크 그래프 + 전략 다이어그램
- 논문 형식 자동 생성 (LaTeX → PDF)