논문 PDF 분석 기능 개발
2일 차에는 논문을 분석하기 위한 PDF 텍스트 추출 기능을 개발했다.
논문의 제목, 초록, 본문, 결론을 자동으로 추출하는 기능을 구현하는 것이 목표였다.
진행 내용
- 논문 PDF에서 텍스트 추출 기능 개발 (PyMuPDF, pdfplumber 활용)
- 논문 구조 분석 알고리즘 구현 – 제목, 초록, 본문, 결론 자동 분류
- Llama 3 모델을 활용한 AI 분석 방향 설정
문제점 & 해결 과정
🚧 논문의 구조가 일관되지 않아, 섹션을 자동으로 구분하는 것이 어려움
🔹 해결책 → 정규 표현식 및 NLP 모델을 활용해 섹션을 자동으로 구분
📌 다음 목표
- 3일 차부터 Llama 3 모델을 활용한 논문 평가 알고리즘 개발 시작
'3️⃣ AI & 자동화 비즈니스' 카테고리의 다른 글
GPT & AI 기반 기업 서비스 분석 (0) | 2025.02.25 |
---|---|
📝 Reevo 개발 일지 – 1일차 (0) | 2025.02.25 |
📝 Reevo: AI 기반 논문 평가 시스템의 개발 (0) | 2025.02.25 |